【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题-每日互联网

摘要:经过4个多月，5618名参加选手、michael i. jordan、蚂蚁金服cto亲自签署证书的大会。

杭州云栖大会期间，第一届atec蚂蚁开发者大会人工智能大会在atec展馆落下帷幕。

这次大会于今年4月18日开始预报名，8月26日的预选结束，持续了131天。好的商业场景和真实的数据集来自世界上20多个国家的1000所大学和公司，近1/3的海外大学有5618名选手参加，是真正国际化的顶级比赛。

有趣的是，在参加者中，拥有硕士以上学历的占70%，领域界的占40%，这次比赛更激烈，更接近实战。

这次大会分为风险脑-支付风险识别、金融脑-智能呼叫nlp相似度计算两个课程，两个课程分别有5个队进入决赛，进行了现场演示和答辩。前三名(共计6支)获得了共计120万元的现金奖励，获得了直通蚂蚁金服集团技术岗的最终资格。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

在颁奖仪式上，蚂蚁金服科学智囊团主席、加利福尼亚大学伯克利分校教授michael i. jordan、蚂蚁金服副总裁、最高数据科学家漆远等学术和领域的嘉宾向获奖小组颁发并签名，拍照留念。

michael i. jordan签署了获奖证书

清华大学朱军教授、哈尔滨工业大学刘挺教授也出席了颁奖仪式，他们是大会的评委。

朱军教授是支付大脑的评委之一，他评价说，关于比赛，ai用于金融，无论是现在学术界还是应用，都是大家关心的事情。但是，ai在领域，为了制作良好的应对方法，需要对问题和场景有非常深入的理解。我觉得你们很棒。你可以实际使用机器学习算法。大家想法一致，但我觉得里面有很多细致的工作，做得很漂亮。特别是除了特色工程之外，我看到大家对原理和做法有一点自己的想法，我觉得这特别值得鼓励。我希望无论从学术界还是工业界来看，都能看到越来越有趣的例子和成果。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

金融大脑比赛结束后，刘挺教授现场致辞:现在的时代真是工业界的领先时代，是做nlp的人，我们的特点是能和工业界结合，得到他们的真实数据。我们现在有机会和工业界合作。越来越多的人倾听工业界的声音，希望他们凝结真正的问题，提供真实的数据。未来希望大家能更深入地分解，原理上，从本源发明创造，去大转弯。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

优秀的数据集和场景吸引了参加经验丰富的工程师致哲，是金融脑课程亚军skyhigh的队长。 skyhigh是一支参加经验丰富的团队，有三个成员，除了已经从事的应缜哲外，还有两个研究生。年认知以来，3人组参加了5、6次比赛，都取得了好成绩。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

致哲表示，这次比赛是国内非常好的中文课题，这场比赛的问题非常少。数据是真实的，我们做了很多有特色的工程。我觉得这是这场比赛最有趣的。另外，是我花时间最多的地方。下一场比赛，如果比赛问题还这么感兴趣的话，我再来。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

蚂蚁金服这次精心提出的两个经典比赛问题到底是什么？两队优胜队分别提出了什么样的解决方案？以下进行详细的解答。

控制老手参加比赛，夺得冠军

移动网络的新金融业务发展迅速，黑产攻击的能力也在提高。新闻泄露盗用和利用了超过亿的机密数据，给顾客和银行造成了巨大的经济损失。保护顾客和风险识别引起了金融领域和学术界的关注。

在这种背景下，蚂蚁金服设置了支付风险识别的比赛问题:年9月至10月的交易数据构建算法识别年2月的交易欺诈行为。

这个问题吸引了许多金融科技行业的资深工作人员参加比赛。获胜的也是风控领域的退役军人，他们的处理方案兼具创新性和实用性。

我们是来自上海的队伍。杀害冰箱的队长熊文文说，团队4人，平均年龄27岁，来自网络金融领域，对风险控制和风险模型的开发有一定的知识。

这场比赛提供了新的场面，大家都想试试。熊文说，他们以前在信用场景中进行风险控制，但与支付场景中的风险控制不同，信用主要描述一个身体(账户)的素质状况，支付不是描述账户的素质，而是描述某个交易异常的状况

你怎么解？他们的特征性工程是以交易账户(人)、交易账户所处的环境、与该账户进行交易的商户这三个要素为中心，这三个要素交叉时间维度，寻找静/动态异常交易的特征。

数据观察发现他们对盗窃刷交易有一定的集中性。例如，1%的客户涵盖了80%的盗窃期。某客户在3天内被盗了几百次某客户(也就是商户)交易了1175次，其中80%是盗窃刷。上一个交易有风险，如果能检测到上一个风险，就可以在判定这笔交易时施加风险。因此，他们创新地提出了先验风险新闻的概念，设计了可以凝结先验风险新闻的模型结构来强化认识效果。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

他们按时间顺序把数据分为第一个月的数据和第二个月的数据。首先，在第1个月的数据中训练3个子模型(各自有重点)，这3个子模型auc停留在0.986左右，判定得分在0.56-0.57之间。使用三个子模型预测第二个月的数据，得到第二个月每宗交易的三个风险得分(即事先风险)，最后将风险得分及其派生变量与第二个月数据的普通变量相加，从而训练模型d。模型d给出的结果是最后的结果。最终，在模型d线上的测试auc达到0.991，在线上的判定点数达到0.7。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

另外，他们发现了白名单的规则。例如，客户每月3000件以后的交易可以直接定义为正常。设备每月400件以后，可以定义为正常。根据白名单的规则，大致可以复盖10%的样品。根据白名单的规则，可以将判定点数提高几千分钟左右。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

分时间段建模，把效果低的早期数据变成变量，进行融合建模的方法，战略+模型的解题构想，获得了第一名的成绩( a排名得分0.627，b排名得分0.797 )，切断了评委们的心。

逆袭:从第十一到第一，有触电的感觉

金融脑的比赛问题是问题相似度的计算，在顾客服务中给出顾客说明的两句话，评价在算法中是否表示同样的意思。

这个任务很有实用价值。优秀的团队是这门课程的冠军，队长的荣誉是“想象你在制造呼叫系统，事前有问题。有答案的表格。呼叫的工作是在实际遇到特定问题时，迅速找到最接近的问题，向客户整理答案。复印系统完成后，可以直接处理第二阶段的问题。也可以在最需要人才的部分找到最近的问题。这可以大大减轻回调的压力，让他们真正处理困难的问题。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

最先知道这场比赛的是研一师弟梁嘉辉，他刚开始接触nlp，想在这场比赛中提高自己的能力。一个人的身体很难参加比赛，所以找到处于学术空档期的段誉(研三)，共同组队参加比赛。一个重要的bug的处理使他们从第十一次逆袭到第一次，有触电感。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

与进入决赛的其他四支队伍相比，他们在特色工程上花费了很少的时间，立足于模型的充分改善和探索，最大限度地发挥了单一模型的效果。

他们最好的成绩是得到了三个模型ensemble，这三个模型的结构几乎一样，细节(比如模型输入)有细微的区别。他们的最佳模型如下。

首先，他们的模型输入是五个级别的char-level feature，除了exact match、idf以外，还自动提取了一些特征。在skip-gram本地训练300维char embedding，为了防止过度合身，训练时住在fix。为了弥补fix失去的模型能力，追加引进了可以在50维训练的char embedding。利用其他文献的方法，分别提取一维的句子间特征和一维的句子本身特征。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

输入层后，引入noise+dropout以提高模型的鲁棒性，以bi-gru为encoder，引入fuse gate以加快新闻流通，以mlp+残差进一步整合新闻。然后对齐两个句子。对准后，通过正交分解，分别提取与关联性没有关联性的报道。

multi-head attention + multi-head pooling在推测了关联状况、非关联状况后，再重复一次mlp+残差，分别得到了关联状况发现、非关联状况发现。 fuse gate在综合考虑两个消息的基础上，经过dropout和双层mlp，得到了最终的结果。

段誉在论坛上分享了自己的经验，他一开始就选择了esim模型。现在比多层互联网结构的nli模型更清楚esim的思路，可以说服我们。网络结构比较简单，不用很多trick，扩展性也强，效果好，所以一目了然。

对nlp语义相似度识别这一任务来说，模型的潜力相当大，我们没有进行任何事前解决，完美保存了各句的所有消息(当然需要padding和拦截)。。我们没有采用英语水平的向量。纯语言水平的向量，在实验中发现基于语言水平的结果一般很差。这与分词质量无关。此外，像gru、lstm这样的互联网引入了fuse gate，因此在某种程度上发挥了作用。但是，经过良好的分词解决，word和char水平的embedding相结合，预计会有一定程度的帮助。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

梁嘉辉说，通过参加这次比赛，体验了深刻的学习魅力，也决定了未来的研究方向——NLP (自然语言解决)。

大会处理实际问题是蚂蚁金服的初衷。我们欢迎越来越多的人参加，学习新技术，用技术处理实际问题。蚂蚁技术合作与快速发展部柴文意是这次大会的负责人，她说，在这次比赛结束后，蚂蚁金服将开放比赛的问题和数据，尽量将参加者的策略、方案应用于蚂蚁金服的实际场景。

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

漆远说，这只是个开始。我们会把这个列一个长期的机制清单，开放平台，让更多的朋友参加这场比赛。

蚂蚁金服副总裁，最高数据科学家漆远

atec竞赛是一个非常好的链接生态平台，将继续举行。柴文意说，接下来，他们将在不同行业发表不同的比赛问题，在领域中凝结一点共同的问题，向选手开放一点敏感的数据，让他们在这个过程中训练和学习。

标题：【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

地址：http://www.miutrip.net.cn/znsb/2572.html

【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题

每日互联网推荐资讯

国内AI智能助手又有大动作，讯飞星火认知大模型成果发布！

2024生意增长在哪?天猫打造5大爆品给出解答!

【科讯】涂鸦智能全球智能化商业峰会，助力开启新时代

京东家电携手创维合作再升级：全年新品发布资源总投入过亿

【科讯】瑞芯微电子人工智能开发平台或成生态链焦点模块化吸睛

金领冠塞纳牧：十大乳清蛋白奶粉品牌中的佼佼者

【科讯】人工智能+农业，佳格天地受邀参展2018华为全联接大会并作主题演讲

【科讯】星环科技，开启公司智能化转型

旅行越野SUV——捷途旅行者即将与大家见面！

【科讯】电信业怎么拥抱人工智能上海联通通用AI能力平台推进智能化变革

每日互联网文章浏览榜

每日互联网最新资讯

每日互联网介绍