声智科技完成2亿元B轮融资
来源:    时间:2019-01-07

近日,声智科技宣布完成B轮2亿元融资,本轮融资后,声智科技将继续投入声学前沿技术和人工智能交互技术的研发,持续不断的挖掘用户需求,保持新技术快速研发迭代,打磨产品的极致用户体验,拓展平台服务落地更多的语音智能垂直场景,为用户提供更多优质的语音交互技术和语言智能服务,加速在各行业的业务拓展以及产品和平台服务的规模化落地应用。


多年积累,专注语音方案前端


据了解,声智科技成立于2016年4月,是一家专注声学前沿技术和人工智能交互的科技创新公司,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案,其中的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术在产业链条上具有领先优势。

声智科技的核心团队来自于中国科学院,积累了多年的声学和语音识别技术,专注解决当前关键的远场语音交互问题。


智能语音热潮下,提供底层技术支持


目前,全球智能语音产品进入了一个激烈竞争期。在亚马逊推出智能音箱Echo之后,谷歌、联想、苹果等也推出了智能音箱;同时国内BAT等推出了以腾讯云小微和DuerOS(度秘)为代表的语音交互系统;小米、京东等也推出了自己的产品。

而在Echo、DuerOS等智能音箱背后,都离不开声学底层技术的支持。

具体来说,一个语音产品方案由前端、云端及内容三部分组成:硬件前端涵括麦克风阵列、降噪算法、芯片、硬件平台等;云端包括语音识别和语义理解、语音数据等;内容合作有音乐、天气、短信、通话等应用工具。

相对于更关注与云端语音识别、语义理解等技术的云知声、思必驰等语音解决方案厂商,声智科技更专注于前端的开发和研究,在云端和内容则选择和合作伙伴进行合作。

而在语音方案前端的底层技术主要解决的,就是语音识别、语义理解及语音合成之前的声音拾取优化问题。

声智科技创始人兼CEO陈孝良此前接受采访时曾表示,真实环境下远场语音识别的准确率都差强人意,这主要是因为,语音往往受到噪声、混响、回声等声学因素的干扰,致使输入云端模型的数据丢失大量特征,真实效果远未达到期望,因此最好从底层的声学技术切入去解决这个难题。


提高语音识别率,加速产品落地


看到这一方向,2016年4月,陈孝良带领团队从中科院离职,成立了声智科技,组建了二十多人的技术团队,对前端技术及硬件进行研究。

其研发的回声抵消、噪声抑制、声源定位、混响消除、声音定向等核心技术和麦克风阵列等硬件已经量产应用,这也意味着解决真实场景下远程语音识别与唤醒的思路经过了验证。

据了解,声智科技目前已经将真实场景下的语音识别率从60%提高到了80%左右(中等阈值),随着场景数据量的增长将达到90%以上的识别率。

而在具体业务上,声智科技目前的业务板块主要分为两部分,已拓展到家居、医疗、机器人、汽车、安防、玩具等场景。

第一部分是「给人听的」通话模块。声智科技与360合作的智能故事机业已上线,在智能安防领域,还有360大水滴和小水滴两款产品推出。

第二部分是「给机器听的」语音交互部分。声智科技目前主打智能音箱,在和百度合作推出的DuerOS软硬件一体化解决方案中,就采用了声智科技的6麦克风远场语音交互标准板解决方案。

目前,声智科技已与ARM、NVIDIA、Xilinx、Cypress、Knowles等芯片和器件厂商合作,同时,与于小米、百度、阿里、华为、腾讯、联想、创维、金蝶、浪潮等企业合作,共同构建智能交互产业的闭环生态。