本篇文章2409字,读完约6分钟
最近,gfk全国零售监测数据显示,过去8月,中国智能扬声器出货量为45万部,尽管超过了同期第一季度的销售额,第三季度的国内智能扬声器市场还是下跌了。 据gfk报道,第四季度的智能扬声器随着国庆节双11销售节双12等节日的促销而爆炸,最终实现了每年900万份的出货量,预计是去年的6倍。
作为物品互联网人工智能的入口,智能语音产品已经成为世界上最富有的科技巨头们的必经之地。 中国语音产业联盟的数据显示,目前世界智能运营市场规模达到105亿美元。 随着个人和家庭客户多场景的支持,各行业应用的智能语音产业规模将持续快速增长,预计每年全球智能语音市场规模将超过140亿美元。
声加科技创始人兼ceo邱锋海表示,在万物相互连接的今天,报道相互作用工具经历了从物理手柄按钮到键盘鼠标、触摸屏、麦克风等语音设备的迅速发展,终于听到了人类最简单自然的交流方法,无处不在 现在,通过深度学习的引进和据此派生的各种模型的组合,语音识别精度确实大幅度提高,智能音频设备也显示了多样性和日常化。 这些产品大大普及了公众对语音相互作用的认识和采用,但由于实际场景采用下的许多复杂性、不同设备的体积限制对计算能力的要求等因素,语音产业的迅速发展仍然受到技术瓶颈的限制,业
智能语音产品完成人机交互需要经过语音前端的解决、语音识别、自然语言理解、语音合成四个主要技术环节,从语音拾取转换为拷贝,理解其含义,进行反馈。 经过多年技术的积累,语音识别和语音合成已经突破,现在基本上可以满足商用。 语音前端的解决和自然语言的理解仍然是语音对话的核心瓶颈。
邱锋海说,各项技术独立迅速发展,但无法与产品割裂,需要在其他技术的协助下,形成具备连锁市场化的终端产品。 现在的bat、小米、京东、华为等大公司基本上从语音识别、语义理解上进入应用后的两个环节。 这主要来自语音识别算法的开源,技术比较普及,对大公司们的大量数据和强大的计算能力的支持有足够的特征。 但是,过程的第一步音响前端解决产品由于在教育环境下人才的断层和稀缺性(迄今为止工程类项目多在科学研究院),因此具有极高的技术门槛。 因此,集中在这个环节的公司基本上集中在中科大、音响所、自动化所等具有科研背景的第一家公司。
音响加工技术成立于今年早些时候,创始人兼ceo邱锋海本科就读于清华大学,硕士期间在中国科学院音响学院深造,毕业后长期在音响芯片公司工作,领导20人研发团队成为世界知名公司的音响解决芯片算法部 cto王之禹,中国科学院声学所博士后,长期从事语音信号的解决和识别研究,实现了许多科研项目的产业化,具有丰富的研发和公司合作经验。 算法科学家郑成诗、声学研究所研究员、德国埃尔朗根-纽伦堡大学客座教授长期从事语音和语音信号的解决研究,作为项目负责人带领团队完成了许多科研项目,创新地完成了多个处理方案
那个核心团队的成员大多和声学院同门,平均在业界有15年以上的经验,博士以上的学历者占80%以上。 在企业成立前,团队已经为国内许多大公司的智能扬声器、智能耳机等明星产品提供了远程场麦阵列模块的设计方案、智能耳机阵列算法、智能耳机模块等实战项目的经验,使其市场化 随着企业的成立,正在把最先进的技术应用到新产品中。 现在音响加工技术的产品计划分为三个阶段。 第一步是为智能语音交互设备和通信设备提供语音前端解决方案.。 第二步是基于迄今为止的事业,上市语音解决专用芯片。 第三步是基于语音解决专用芯片开发各种麦克风阵列模块,为顾客提供语音前端解决方案的整体处理方案。 现在的第一阶段的算法产品已经通过了国内大工厂的验证,预计量产的芯片和模块产品也在迅速发展。 同时期与国内巨头合作的第二代产品也将于下半年陆续上市,是疯狂增长的生态链的重要一环。
邱锋海和声加团队恩师表示,中国空气音响行业著名科学家、中国科学院音响研究所研究员/博士课程李晓东认为,音响尖端技术在声音相互作用突破之前,一直是冷门学科,学科设置非常少,全国每年毕业的博士都合格。 另外,音响前端技术是应用类学科,需要积累很多课题、项目,培养音响方面的专家,很多情况下需要4、5年以上。 因此,长期以来,从事声学前端解决技术的高端人才集中在国家相关科学研究院。 对于不缺钱的大公司们来说,组建一支有实力的音响前端解决技术团队也不容易。
李晓东说,虽然现在市场增长良好,但现在的音响技术依然处于商业的初期应用阶段,离顾客满意有相当大的距离。 例如,以siri为代表的近场声音识别的要求必须是低噪音、无混响、接近声源的场景,顾客为了得到满足近场声音识别的要求的声音信号必须与手机搭话,环境稍微吵闹时声音识别引擎就会发生故障的智能 这些限制需要音响前端解决技术不断改进,实现噪声抑制、混响去除、人声干扰抑制、声源测量、声源跟踪、阵列增益等功能,提高语音信号解决质量,提高各种环境下的语音识别率。 也是声加队致力于突破的方向。
迄今为止的音响加工技术根据其技术特征和人才储备得到了中科创星的数千万级和万魔音响数百万级的天使轮融资,并成为万魔音响和战术合作伙伴,两者在智能音频设备上继续合作。 随着产品的上市和进一步研究开发的需要,目前音响加工技术正在进行以下融资。
万魔音响cto黎懋说,音响加工技术提供的声音增强技术( enc )在引进产品后的短时间内,以各项指标成功超过了现有产品的水平。 这不仅帮助万魔用一些热点产品迅速提高市场占有率,而且为音响和技术创造了新创企业的难得势头和迅速发展的动能。 而且,除了优秀的技术力量,音响和科学技术的核心团队已经经过多年的合作,志同道合,强调了默契充分、专业、热情、高效、专注的团队。
最后,邱锋海从技术角度对领域表示期待,以往,人与机器的交互充满了想象,未来也有可能与机器的视觉、脑科学等相融合,实现电影中的酷画面。 现在只有先处理语音识别的这些技术瓶颈,才能进一步做点什么。
标题:【科讯】声学前端技术获突破 声加科技重新定义智能语音时代
地址:http://www.miutrip.net.cn/znsb/3892.html