本篇文章3868字,读完约10分钟
摘要:经过4个多月,5618名参加选手、michael i. jordan、蚂蚁金服cto亲自签署证书的大会。
杭州云栖大会期间,第一届atec蚂蚁开发者大会人工智能大会在atec展馆落下帷幕。
这次大会于今年4月18日开始预报名,8月26日的预选结束,持续了131天。 好的商业场景和真实的数据集来自世界上20多个国家的1000所大学和公司,近1/3的海外大学有5618名选手参加,是真正国际化的顶级比赛。
有趣的是,在参加者中,拥有硕士以上学历的占70%,领域界的占40%,这次比赛更激烈,更接近实战。
这次大会分为风险脑-支付风险识别、金融脑-智能呼叫nlp相似度计算两个课程,两个课程分别有5个队进入决赛,进行了现场演示和答辩。 前三名(共计6支)获得了共计120万元的现金奖励,获得了直通蚂蚁金服集团技术岗的最终资格。
在颁奖仪式上,蚂蚁金服科学智囊团主席、加利福尼亚大学伯克利分校教授michael i. jordan、蚂蚁金服副总裁、最高数据科学家漆远等学术和领域的嘉宾向获奖小组颁发并签名,拍照留念。
michael i. jordan签署了获奖证书
清华大学朱军教授、哈尔滨工业大学刘挺教授也出席了颁奖仪式,他们是大会的评委。
朱军教授是支付大脑的评委之一,他评价说,关于比赛,ai用于金融,无论是现在学术界还是应用,都是大家关心的事情。 但是,ai在领域,为了制作良好的应对方法,需要对问题和场景有非常深入的理解。 我觉得你们很棒。 你可以实际使用机器学习算法。 大家想法一致,但我觉得里面有很多细致的工作,做得很漂亮。 特别是除了特色工程之外,我看到大家对原理和做法有一点自己的想法,我觉得这特别值得鼓励。 我希望无论从学术界还是工业界来看,都能看到越来越有趣的例子和成果。
金融大脑比赛结束后,刘挺教授现场致辞:现在的时代真是工业界的领先时代,是做nlp的人,我们的特点是能和工业界结合,得到他们的真实数据。 我们现在有机会和工业界合作。 越来越多的人倾听工业界的声音,希望他们凝结真正的问题,提供真实的数据。 未来希望大家能更深入地分解,原理上,从本源发明创造,去大转弯。
优秀的数据集和场景吸引了参加经验丰富的工程师致哲,是金融脑课程亚军skyhigh的队长。 skyhigh是一支参加经验丰富的团队,有三个成员,除了已经从事的应缜哲外,还有两个研究生。 年认知以来,3人组参加了5、6次比赛,都取得了好成绩。
致哲表示,这次比赛是国内非常好的中文课题,这场比赛的问题非常少。 数据是真实的,我们做了很多有特色的工程。 我觉得这是这场比赛最有趣的。 另外,是我花时间最多的地方。 下一场比赛,如果比赛问题还这么感兴趣的话,我再来。
蚂蚁金服这次精心提出的两个经典比赛问题到底是什么? 两队优胜队分别提出了什么样的解决方案? 以下进行详细的解答。
控制老手参加比赛,夺得冠军
移动网络的新金融业务发展迅速,黑产攻击的能力也在提高。 新闻泄露盗用和利用了超过亿的机密数据,给顾客和银行造成了巨大的经济损失。 保护顾客和风险识别引起了金融领域和学术界的关注。
在这种背景下,蚂蚁金服设置了支付风险识别的比赛问题:年9月至10月的交易数据构建算法识别年2月的交易欺诈行为。
这个问题吸引了许多金融科技行业的资深工作人员参加比赛。 获胜的也是风控领域的退役军人,他们的处理方案兼具创新性和实用性。
我们是来自上海的队伍。 杀害冰箱的队长熊文文说,团队4人,平均年龄27岁,来自网络金融领域,对风险控制和风险模型的开发有一定的知识。
这场比赛提供了新的场面,大家都想试试。 熊文说,他们以前在信用场景中进行风险控制,但与支付场景中的风险控制不同,信用主要描述一个身体(账户)的素质状况,支付不是描述账户的素质,而是描述某个交易异常的状况
你怎么解? 他们的特征性工程是以交易账户(人)、交易账户所处的环境、与该账户进行交易的商户这三个要素为中心,这三个要素交叉时间维度,寻找静/动态异常交易的特征。
数据观察发现他们对盗窃刷交易有一定的集中性。 例如,1%的客户涵盖了80%的盗窃期。 某客户在3天内被盗了几百次某客户(也就是商户)交易了1175次,其中80%是盗窃刷。 上一个交易有风险,如果能检测到上一个风险,就可以在判定这笔交易时施加风险。 因此,他们创新地提出了先验风险新闻的概念,设计了可以凝结先验风险新闻的模型结构来强化认识效果。
他们按时间顺序把数据分为第一个月的数据和第二个月的数据。 首先,在第1个月的数据中训练3个子模型(各自有重点),这3个子模型auc停留在0.986左右,判定得分在0.56-0.57之间。 使用三个子模型预测第二个月的数据,得到第二个月每宗交易的三个风险得分(即事先风险),最后将风险得分及其派生变量与第二个月数据的普通变量相加,从而训练模型d。 模型d给出的结果是最后的结果。 最终,在模型d线上的测试auc达到0.991,在线上的判定点数达到0.7。
另外,他们发现了白名单的规则。 例如,客户每月3000件以后的交易可以直接定义为正常。 设备每月400件以后,可以定义为正常。 根据白名单的规则,大致可以复盖10%的样品。 根据白名单的规则,可以将判定点数提高几千分钟左右。
分时间段建模,把效果低的早期数据变成变量,进行融合建模的方法,战略+模型的解题构想,获得了第一名的成绩( a排名得分0.627,b排名得分0.797 ),切断了评委们的心。
逆袭:从第十一到第一,有触电的感觉
金融脑的比赛问题是问题相似度的计算,在顾客服务中给出顾客说明的两句话,评价在算法中是否表示同样的意思。
这个任务很有实用价值。 优秀的团队是这门课程的冠军,队长的荣誉是“想象你在制造呼叫系统,事前有问题。 有答案的表格。 呼叫的工作是在实际遇到特定问题时,迅速找到最接近的问题,向客户整理答案。 复印系统完成后,可以直接处理第二阶段的问题。 也可以在最需要人才的部分找到最近的问题。 这可以大大减轻回调的压力,让他们真正处理困难的问题。
最先知道这场比赛的是研一师弟梁嘉辉,他刚开始接触nlp,想在这场比赛中提高自己的能力。 一个人的身体很难参加比赛,所以找到处于学术空档期的段誉(研三),共同组队参加比赛。 一个重要的bug的处理使他们从第十一次逆袭到第一次,有触电感。
与进入决赛的其他四支队伍相比,他们在特色工程上花费了很少的时间,立足于模型的充分改善和探索,最大限度地发挥了单一模型的效果。
他们最好的成绩是得到了三个模型ensemble,这三个模型的结构几乎一样,细节(比如模型输入)有细微的区别。 他们的最佳模型如下。
首先,他们的模型输入是五个级别的char-level feature,除了exact match、idf以外,还自动提取了一些特征。 在skip-gram本地训练300维char embedding,为了防止过度合身,训练时住在fix。 为了弥补fix失去的模型能力,追加引进了可以在50维训练的char embedding。 利用其他文献的方法,分别提取一维的句子间特征和一维的句子本身特征。
输入层后,引入noise+dropout以提高模型的鲁棒性,以bi-gru为encoder,引入fuse gate以加快新闻流通,以mlp+残差进一步整合新闻。 然后对齐两个句子。 对准后,通过正交分解,分别提取与关联性没有关联性的报道。
multi-head attention + multi-head pooling在推测了关联状况、非关联状况后,再重复一次mlp+残差,分别得到了关联状况发现、非关联状况发现。 fuse gate在综合考虑两个消息的基础上,经过dropout和双层mlp,得到了最终的结果。
段誉在论坛上分享了自己的经验,他一开始就选择了esim模型。 现在比多层互联网结构的nli模型更清楚esim的思路,可以说服我们。 网络结构比较简单,不用很多trick,扩展性也强,效果好,所以一目了然。
对nlp语义相似度识别这一任务来说,模型的潜力相当大,我们没有进行任何事前解决,完美保存了各句的所有消息(当然需要padding和拦截)。 。 我们没有采用英语水平的向量。 纯语言水平的向量,在实验中发现基于语言水平的结果一般很差。 这与分词质量无关。 此外,像gru、lstm这样的互联网引入了fuse gate,因此在某种程度上发挥了作用。 但是,经过良好的分词解决,word和char水平的embedding相结合,预计会有一定程度的帮助。
梁嘉辉说,通过参加这次比赛,体验了深刻的学习魅力,也决定了未来的研究方向——NLP (自然语言解决)。
大会处理实际问题是蚂蚁金服的初衷。 我们欢迎越来越多的人参加,学习新技术,用技术处理实际问题。 蚂蚁技术合作与快速发展部柴文意是这次大会的负责人,她说,在这次比赛结束后,蚂蚁金服将开放比赛的问题和数据,尽量将参加者的策略、方案应用于蚂蚁金服的实际场景。
漆远说,这只是个开始。 我们会把这个列一个长期的机制清单,开放平台,让更多的朋友参加这场比赛。
蚂蚁金服副总裁,最高数据科学家漆远
atec竞赛是一个非常好的链接生态平台,将继续举行。 柴文意说,接下来,他们将在不同行业发表不同的比赛问题,在领域中凝结一点共同的问题,向选手开放一点敏感的数据,让他们在这个过程中训练和学习。
标题:【科讯】蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕,一文详解最佳解题
地址:http://www.miutrip.net.cn/znsb/2572.html