本篇文章638字,读完约2分钟

10月20日,ai challenger进入传智汇Sogou专场在上海举行。 ai challenger是面向全球人工智能人才的开放数据集和编程竞赛平台,致力于构建大型、全面的科研数据集和世界级竞赛平台。 作为发起人之一,继去年开设翻译课程之后,这次Sogou追加了q&a行业课程,在口语行业、机器阅读理解行业开设了世界上最大规模、难度较高的数据集。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

在共享会上,Sogou企业专家研究员翟飞、Sogou杭州研究院首席研究员张奇分别共享了Sogou在翻译和问答行业的技术研究和成果。 翟飞说,现在的翻译大多基于一个句子进行,但实际生活中的应用范围是场景和章节,通过我们的共享,可以帮助大家在翻译上进行越来越多的探索。 张奇介绍了机器问答技术。 整个问答是检索和阅读理解,各搜索引擎在从搜索关键词链接中检索问句得到答案的时代迅速发展起来。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

拥有庞大客户数量的Sogou,积累了庞大的数据集,这次为了大会打开了公司级的数据集,另一方面,比较有效地处理了ai技术落地中的数据集缺失问题,使ai技术更实用化来应对现实世界的问题。 另一方面,为人工智能产业发掘和培养优秀人才,促进领域的快速发展创新。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

世界上最大的数据集,让翻译体验更有人情味

随着全球化的发展,跨国交流正在成为常态,人工翻译门槛高,入门慢,无法满足人们爆炸性增长的交流诉求,机器翻译越来越成为跨语言交流工具

( Sogou企业专家翟飞研究员在会上演讲)

在ai技术正式应用于翻译之前,语序紊乱、翻译速度慢等问题层出不穷,对机器翻译的能力不满意。 但是,在实际研究中,数据的缺失给机器翻译技术的开发和落地的应用带来了很多限制和课题,机器翻译必须真正应用于实际生活,许多复杂的应用场景也对数据的选择提出了更高的要求。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

年,Sogou作为主办者之一,在第一届ai challenger主办了翻译课程,开放了1000万规模的中英双语数据集,有超过2000支队伍的6000名选手参加。 今年,Sogou再次开设翻译行业课程英中复印机翻译,根据去年1000万级中英双语数据,追加具有300万语境情景的双语数据,作为1300万世界规模最大口语行业英中双语的对照 实际上有价值的企业级数据为机器翻译的研究提供了越来越多的探索空间使翻译产品的采用体验更有人情味。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

公司级数据是Sogou在机器翻译行业多年积累的,翻译是Sogouai战术的重要一环,Sogou已经取得了阶段性成果,不仅在国际学术比赛wmt的中层获得了中英和英中机器翻译的双向冠军, 同时推出了世界上第一款基于商用深度神经网络的同声传译技术,在先进技术的支持下,Sogou推出了英语检索、翻译宝pro等硬件和软件产品,使ai翻译技术实用化,技术落到了真正的地步。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

世界上难度最大的数据集存储了提供更正确答案的力量

机器的使命之一是与人进行信息表达,如何使人与机器更自然地与信息表达进行对话是当今人工智能技术迅速发展的前沿议题。 随着人工智能的迅速发展,对话技术成为推动人与机器自然信息表达的下一个动力,对话相当于探索和阅读理解,让机器首先理解问题,然后从大量网页中寻找问题的答案。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

( Sogou杭州研究院首席研究员张奇在会上发表了演讲)

在今年的ai challenger中,除了课程的翻译外,Sogou还增设了问答行业课程。 观点型问题机器的阅览理解,共计开放30万规模的数据集,数据包括问题、短文事件和回答。 这次开放的问答数据不仅是世界上难度最高的中文阅读理解开源数据集,也是世界上最大的观点型机器阅读理解公开数据集。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

事实上,在很多问答比赛中,采用的数据不是真实的问题,而是人为构建的,与现实有很大差距。 Sogou检索作为国内第二大检索,拥有5亿以上的顾客规模,积累了丰富而真实的数据。 在这次ai challenger竞赛中,Sogou在q&a课程中比阅读理解复杂,但非常典型的观点型问题构建了大规模的词汇,词汇来自客户的真正问题和真实诉求,参加团队实现了实用化程度较高的研究,

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

ai应对现实世界的问题,使技术真正走向生活

在ai chanllenger开幕式上,SogouCEO王小川说,数据是ai开发的核心,如果没有真实的数据,应用场景会错位,技术研究方向具体算法会出错。

真实的网络数据是开展前沿技术研究的最重要依赖,2006年Sogou与清华大学联合成立了清华Sogou检索技术联合实验室,将积累的大数据资产开放给大学,共同推进了前沿技术研究和进步。

在这次挑战中,Sogou不仅提供主题和课程,而且向课程开放公司级数据集,其重量级、真实数据集为人工智能的实际诉求研究提供力量,保护和护卫技术的应用场景。 另外,Sogou也与优秀人才进行进一步的信息表现交流,共同提高研究的实用价值,使人工智能更实用化。

【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

王小川认为人工智能和人类不是替代的关系,合作的关系最终是人类能力的延长。 作为人工智能行业的开拓者,Sogou以开放的力量整合创新能力,培养和输送人工智能领域的人才,为领域的进步和快速发展提供推动力,推进中国人工智能行业的科研创新。

标题:【科讯】AI Challenger大赛:搜狗开设翻译、问答双赛道,公司级数据集助力AI技术

地址:http://www.miutrip.net.cn/news/2176.html