【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极-每日互联网

10月27-28日，一年一度的中国音响行业技术交流盛会音响楼13周年年会及中国音响领域白皮书发布会在深圳市南山区金百合大酒店隆重举行。这次大会以稳步前进、稳定发展为主题，邀请了中国科学院音响所、万魔音响、科大讯飞、小米科技、猫王收音机、楼氏电子等院和公司60人领域的大咖啡，来自全国各地的知名专家学者、领域著名公司家、资深人士

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

来自全国各地的技术人员参加了

客满的大会现场

其中，在27日下午的特邀特辑报告中，北京音加科技ceo邱锋海以“音加万物，听未来:智能语音对话应用与技术”为主题，邀请大家与现在火爆的智能语音对话市场各明星产品共享其技术链。然后，在演讲中详细分析了音响前端技术面临的挑战和机遇:在百花齐放的新生市场上，智能扬声器的插件电气化，麦克风构成的阵列减少，更灵活的唤醒语的训练和生成和智能耳机

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

音响加工技术ceo邱锋海主题共享《音响加工万物，听未来:智能语音对话应用与技术》

邱锋海说，10万年前，语言的出现极大地加速了人类社会的进化和快速发展进程。直到现在，听和说依然是人类最基本、最常用、最灵活的交流方法，而且也是最好的人类机械交互方法。从计算机指令性交互到图形界面的触摸交互，经过新闻时代/高级新闻时代的自然交互，情感交互，语音交互是普遍的人机交互的

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

事实上，语音识别技术的研究可追溯到20世纪50年代，从单一模式匹配到70年代的模式和特征分解，再到90年的统计方法( hmm+gmm )，到年后，深神经网络( dnn )取得了很大的成就此外，语音识别、自然语言理解、语音合成性能等技术大幅度提高，网络、移动网络的迅速发展也为算法引擎提供了大量的数据粮食。在大量的数据红利下，云计算的硬件和软件系统的计算能力增加，可以迅速解决大量的数据，加上边缘计算的能力增强、功耗降低等因素，语音交互的基础设施因此，智能语音交互的兴起也是有道理的。

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

但是，虽然语音识别在这几年发展迅速，但目前业界主张语音识别的精度达到了90%以上(谷歌声称去年6月达到了95%的精度)的实际上是实验室数据。在不纯粹条件下的现实生活中，这个精度会下降到50-70%，甚至更低。

智能语音产品经过语音前端解决、语音识别( asr )、自然语言理解( nlp )、语音合成( tts )四个主要技术要素，从语音的拾取到拷贝。其中语音前端的解决是客户端，后者是云。经过多年技术的积累，语音识别和语音合成已经取得突破，基本上可以满足商用。语音前端的解决和自然语言的理解仍然是语音对话的核心瓶颈。

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

语音交互的技术链

作为人机交互最下层的一环，语音前端解决了包括回声消除、声源指向性、语音噪声降低、语音中断、语音唤醒的麦克风阵列，通过麦克风阵列实现多噪声环境下的收音。现在也处于商业的初级应用阶段，距离离理想的体验有很大的距离。例如，以siri为代表的近场声音识别的要求必须是低噪音、无混响、接近声源的场景，客户为了得到满足近场声音识别的要求的声音信号，必须对手机说话，环境稍微吵闹时声音识别引擎就会发生故障的智能体

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

邱锋海认为，现在智能扬声器、智能耳机等产品的技术难关是回声消除、立体回声消除、混响消除、自适应波束形成(抗干扰)、前端信号解决+kws等。语音前端信号解决的算法也面临着单通道dnn语音增强、自噪声抑制、多声道dnn语音增强等多个课题。另外，他在演讲的最后留下了一些开放性问题:由智能扬声器更少的麦克风组成的阵列(两个或三个)、更低的计算功耗、更长的不插入等待时间、更灵活的唤醒语训练、生成等蓝牙扬声器关于智能手机的尺寸小，在引入其他传感器后，融合各类型的传感器数据，体验更低功耗的觉醒、更好的语音交互功能等。

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

现在，在智能语音对话市场上，国内的玩家一直被分为语音技术制造商、网络制造商和新兴的创业企业。其中大部分集中在语音识别( asr )、自然语言理解( nlp )和语音合成( tts )等云服务上，这也归结于语音前端解决技术的人才不足和实战项目少，缺乏经验积累等。与这些玩家相比，声加科学技术越来越致力于解决全场景下的语音前端，其强大的研发力量依靠中国科学院声学院的足够人才和科研资源，研发人员都是中国科学院声学院、清华大学、南京大学和中国科学技术团队迄今为止为国内许多大型公司的智能扬声器、智能耳机等明星产品提供了远程麦阵模块的设计方案、智能耳机麦阵算法、智能耳机模块等技术支持。

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

适用于多场景的多种智能设备

音响楼作为国内最专业、最盛大的电声技术研讨会之一，这次大会不仅再次引起了中国音响技术交流的高潮，而且在开幕当天上午，中国电子音响领域协会秘书长陈立新发表了《中国电子音响领域的迅速发展状况》(白皮书邀请中国科学院音响所的李晓东教授、魅族音响总监陈爱民、哈曼汽车电子全球研究开发中心扬声器系统工程总监杨春洪、四川湖山电子高级工程师张康等行业内专家，分别在智能扬声器领域、耳机领域、汽车值得一提的是，参与“中国智能扬声器领域快速发展状况”主笔的李晓东教授不仅是邱锋海和和声科技数字成员在声学研究所深造的领导人，也是鼓励创业的前辈。

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

中国科学院音响所的李晓东教授、博导主题介绍了《中国智能扬声器领域的迅速发展状况》(版)的编制情况。

2005年成立的音响楼是提供给音响专家和电声技术人员的专业技术和新闻交流的开放性论坛。创立以来，有10万多名来自世界各地的音响技术人员注册会员，包括jbl、飞利浦、诺基亚、索尼、三星、松下、先驱、恩智浦半导体、tymphany、celestion等世界知名公司的技术人员在内，开会国内会员来自各机构及科学研究院。有些会员是一流大学的硕士博士、博导教授和高级管理者。可以说那个论坛的影响在国内音响行业绝对没有。

标题：【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

地址：http://www.miutrip.net.cn/news/1241.html

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极

每日互联网推荐资讯

市场产品控价维权有哪些方法

地球使用说明书：一本全人类的守护秘籍

想听宝藏原创？网易云音乐如何帮你发现和推广好作品

【科讯】眼控科技聚焦航空气象服务，助力提升航空安全保障水平

【科讯】首都新闻&百望云以数字化能力助力智慧城市建设

【科讯】炫彩互动与Savy Soda签约获《Pixel Starships》中国区代理权

如何破解《[墨子](@replace=10001)》古文翻译的千年密码？

【科讯】AI+零售苏宁科技COO荆伟诠释智慧零售时代核心竞争力

充电站行业新纪元：AI元宇宙搜索平台，一键解锁全维信息宇宙

【科讯】马克水印相机与正源物业团队达成合作，引领物业管理模式改革创新

每日互联网文章浏览榜

译达通翻译软件：多语言沟通的得力助手

以为填了就年轻？印第安纹改善的3个致命误区

搜狗拼音输入法设置技巧:词库同步+高效打字全攻略

尚海整装小户型装修：打造舒适大气的家居空间，提升生活品质

啪嗒啪嗒主题曲如何成为万人迷的节奏密码？

行业领军人物何金松“ 中国人工智能”平台

国泰金马基金：它到底值不值得你投资？

The Definitive Guide to Shacman Tractor Trucks: Performance,

零点有数AIKC：基于数据智能与知识智能重构建筑工程产业

香港全球卫视与上海环球台商中心携手共创中华文明全球传播平台

每日互联网最新资讯

每日互联网介绍

【科讯】声加科技邱锋海预测机器听觉将仿生人耳 两颗传声器阵列或是终极

每日互联网推荐资讯

每日互联网文章浏览榜

每日互联网最新资讯

每日互联网介绍

【科讯】声加科技邱锋海预测机器听觉将仿生人耳两颗传声器阵列或是终极