本篇文章1120字,读完约3分钟

9月22日,在云栖大会知识地图专场,阿里巴巴文化娱乐集团uc神马检索高级算法专家华能威发表演讲,uc神马根据检索和蚂蚁生态大数据,构建全盖、优质的共同区域知识地图,应用于检索和天猫妖精智能扬声器

据介绍,基于内外区域庞大的数据和多样性业务的长时间打磨和沉淀,阿里巴巴构建了世界上最大的知识地图。 其中,神马搜索共同区域知识图像从年第一版开始在线,从年开始广泛应用于搜索、年服务新闻流、年现在点服务对话机器人、天猫精灵智能扬声器等创新应用。

【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

uc神马在构建共同知识图像时,重点是人物、场所、组织机构、电影作品、3c、软件游戏等核心抽象实体的建设。 数据源包括大量的web库、百科、检索协作cp等,这些数据每天更新,由知识地图构建的技术陆续整合到知识地图中。

【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

目前,uc神马根据搜索和蚂蚁生态数据,构建了包括人物、地点、组织机构和概念等5000万实体、28亿实体之间相关关系在内的强大公共领域知识图谱,复盖了90多个行业的1600多种类型。 这是神马长期积累下来的技术特征。

华能威氏说,神马知识图像的第一个技术点和特征是非结构化拷贝的知识提取、大规模知识融合、实体识别和链接。 比较整个网页的自动知识提取技术、多源异构数据集成方法、基于搜索数据的深度命名实体识别技术,帮助处理自然语言解决、新闻组织和智能服务两大问题。

【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

客户搜索时,直接提供新闻、回答和相关实体的建议。 此外,问答功能还可以进一步服务智能对话。 不久前的淘宝造物节上,天猫妖精的奇声实验室客满。 依赖丰富的知识图谱,天猫精灵完成了与客户的百科问答、聊天等实时交互,显示了领域第一的服务达成能力,背后是uc神马基于知识图谱能力和搜索大数据,行业领先的问答系统

【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

在扬声器场景中,人和机器为了用语音进行自然语言的交互,需要更正确地理解查询的意思、副本,对答案的权威、可读性有更高的要求。 这个指控和知识地图很吻合。 现在开放行业的问答依然面临着两大课题,另一方面是长尾知识的获得、表示、问题的理解和解析,另一个难点是很多问题需要大部分的拷贝,仅仅与实体有关是不够的。

【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

华能威表示,神马整合了多种数据和技术,建设了面向对话场景的开放域对话系统,有直接基于知识图像的对话,这一部分与搜索中的知识图像对话类似,不同之处在于加强口语化query分析,对答案

随着共同知识地图的业务范围越来越广,有更多的诉求,但蚂蚁的生态有不同行业和场景下的知识地图。 华能威表示,uc神马正在积极探索更灵活高效的构建方法,支持许多复杂多样的业务诉求,通过许多行业的数据。 开放数据、开放算法能力、建立数据之间的关联性、与各业务方向共同建立数据交换、数据共享、数据增值的新模型,最终为业务和领域提供力量。

标题:【科讯】云栖大会UC解密知识图谱构建,探索平台模式服务多端场景

地址:http://www.miutrip.net.cn/news/3634.html