本篇文章2351字,读完约6分钟
10月27-28日,一年一度的中国音响行业技术交流盛会音响楼13周年年会及中国音响领域白皮书发布会在深圳市南山区金百合大酒店隆重举行。 这次大会以稳步前进、稳定发展为主题,邀请了中国科学院音响所、万魔音响、科大讯飞、小米科技、猫王收音机、楼氏电子等院和公司60人领域的大咖啡,来自全国各地的知名专家学者、领域著名公司家、资深人士
来自全国各地的技术人员参加了
客满的大会现场
其中,在27日下午的特邀特辑报告中,北京音加科技ceo邱锋海以“音加万物,听未来:智能语音对话应用与技术”为主题,邀请大家与现在火爆的智能语音对话市场各明星产品共享其技术链。 然后,在演讲中详细分析了音响前端技术面临的挑战和机遇:在百花齐放的新生市场上,智能扬声器的插件电气化,麦克风构成的阵列减少,更灵活的唤醒语的训练和生成和智能耳机
音响加工技术ceo邱锋海主题共享《音响加工万物,听未来:智能语音对话应用与技术》
邱锋海说,10万年前,语言的出现极大地加速了人类社会的进化和快速发展进程。 直到现在,听和说依然是人类最基本、最常用、最灵活的交流方法,而且也是最好的人类机械交互方法。 从计算机指令性交互到图形界面的触摸交互,经过新闻时代/高级新闻时代的自然交互,情感交互,语音交互是普遍的人机交互的
事实上,语音识别技术的研究可追溯到20世纪50年代,从单一模式匹配到70年代的模式和特征分解,再到90年的统计方法( hmm+gmm ),到年后,深神经网络( dnn )取得了很大的成就 此外,语音识别、自然语言理解、语音合成性能等技术大幅度提高,网络、移动网络的迅速发展也为算法引擎提供了大量的数据粮食。 在大量的数据红利下,云计算的硬件和软件系统的计算能力增加,可以迅速解决大量的数据,加上边缘计算的能力增强、功耗降低等因素,语音交互的基础设施 因此,智能语音交互的兴起也是有道理的。
但是,虽然语音识别在这几年发展迅速,但目前业界主张语音识别的精度达到了90%以上(谷歌声称去年6月达到了95%的精度)的实际上是实验室数据。 在不纯粹条件下的现实生活中,这个精度会下降到50-70%,甚至更低。
智能语音产品经过语音前端解决、语音识别( asr )、自然语言理解( nlp )、语音合成( tts )四个主要技术要素,从语音的拾取到拷贝。 其中语音前端的解决是客户端,后者是云。 经过多年技术的积累,语音识别和语音合成已经取得突破,基本上可以满足商用。 语音前端的解决和自然语言的理解仍然是语音对话的核心瓶颈。
语音交互的技术链
作为人机交互最下层的一环,语音前端解决了包括回声消除、声源指向性、语音噪声降低、语音中断、语音唤醒的麦克风阵列,通过麦克风阵列实现多噪声环境下的收音。 现在也处于商业的初级应用阶段,距离离理想的体验有很大的距离。 例如,以siri为代表的近场声音识别的要求必须是低噪音、无混响、接近声源的场景,客户为了得到满足近场声音识别的要求的声音信号,必须对手机说话,环境稍微吵闹时声音识别引擎就会发生故障的智能体
邱锋海认为,现在智能扬声器、智能耳机等产品的技术难关是回声消除、立体回声消除、混响消除、自适应波束形成(抗干扰)、前端信号解决+kws等。 语音前端信号解决的算法也面临着单通道dnn语音增强、自噪声抑制、多声道dnn语音增强等多个课题。 另外,他在演讲的最后留下了一些开放性问题:由智能扬声器更少的麦克风组成的阵列(两个或三个)、更低的计算功耗、更长的不插入等待时间、更灵活的唤醒语训练、生成等蓝牙扬声器 关于智能手机的尺寸小,在引入其他传感器后,融合各类型的传感器数据,体验更低功耗的觉醒、更好的语音交互功能等。
现在,在智能语音对话市场上,国内的玩家一直被分为语音技术制造商、网络制造商和新兴的创业企业。 其中大部分集中在语音识别( asr )、自然语言理解( nlp )和语音合成( tts )等云服务上,这也归结于语音前端解决技术的人才不足和实战项目少,缺乏经验积累等。 与这些玩家相比,声加科学技术越来越致力于解决全场景下的语音前端,其强大的研发力量依靠中国科学院声学院的足够人才和科研资源,研发人员都是中国科学院声学院、清华大学、南京大学和中国科学技术 团队迄今为止为国内许多大型公司的智能扬声器、智能耳机等明星产品提供了远程麦阵模块的设计方案、智能耳机麦阵算法、智能耳机模块等技术支持。
适用于多场景的多种智能设备
音响楼作为国内最专业、最盛大的电声技术研讨会之一,这次大会不仅再次引起了中国音响技术交流的高潮,而且在开幕当天上午,中国电子音响领域协会秘书长陈立新发表了《中国电子音响领域的迅速发展状况》(白皮书 邀请中国科学院音响所的李晓东教授、魅族音响总监陈爱民、哈曼汽车电子全球研究开发中心扬声器系统工程总监杨春洪、四川湖山电子高级工程师张康等行业内专家,分别在智能扬声器领域、耳机领域、汽车 值得一提的是,参与“中国智能扬声器领域快速发展状况”主笔的李晓东教授不仅是邱锋海和和声科技数字成员在声学研究所深造的领导人,也是鼓励创业的前辈。
中国科学院音响所的李晓东教授、博导主题介绍了《中国智能扬声器领域的迅速发展状况》(版)的编制情况。
2005年成立的音响楼是提供给音响专家和电声技术人员的专业技术和新闻交流的开放性论坛。 创立以来,有10万多名来自世界各地的音响技术人员注册会员,包括jbl、飞利浦、诺基亚、索尼、三星、松下、先驱、恩智浦半导体、tymphany、celestion等世界知名公司的技术人员在内,开会 国内会员来自各机构及科学研究院。 有些会员是一流大学的硕士博士、博导教授和高级管理者。 可以说那个论坛的影响在国内音响行业绝对没有。
标题:【科讯】声加科技邱锋海预测机器听觉将仿生人耳 两颗传声器阵列或是终极
地址:http://www.miutrip.net.cn/news/1241.html