灵动双耳再升级 灵云麦克风阵列助推远场语音交互新时代

随着智能化设备的快速普及,如何让像智能电视这样的设备更“聪明”地听懂主人的指令,成为智能硬件生产厂商提高产品体验的焦点技术。由于环境噪音、混响等多重复杂因素干扰,许多近讲语音交互技术在落地应用时受到了一定的制约。

解决噪音问题,排除外界干扰,追求真实环境下更自然人机交互方式,提升远场语音识别率成了智能硬件厂商的迫切需求。对此,捷通华声早在2015年推出了灵云麦克风阵列技术,利用软硬件一体化解决方案,让智能硬件设备拥有“灵动双耳”,成功实现智能设备在复杂声源环境下的远场语音识别。

全新升级  让每个智能硬件更懂你

近日,智能硬件市场的迫切需求推动,在捷通华声研发团队的共同努力下,灵云麦克风阵列技术再次升级,成功实现了远场语音识别在识别准确率、噪声抑制、声源追踪等技术上的大幅提升:

语音唤醒:新升级的麦克风阵列支持1个或者多个唤醒词,且唤醒词可定制,并支持第三方唤醒词,5米唤醒率 > 95%,误唤醒率 < 1次/24小时;

回声消除:支持单声道/立体声双声道回声信号输入,采样率16000Hz,采样位数16bit,麦克风处的音量为80db,消回声残留比例<5%,让麦克风阵列在电视、音箱等使用场景下能够保证极高的识别率。

声源定向:支持2/4/6个麦克风,线性/环形布局,180°/360°声源定向。线性布局阵列定向精度 < ±15°,环形布局阵列定向精度 < ±10°,让灵云麦克风阵列可以轻松应用到音箱、电视、空调、机器人等等各式各样的场景中;

语音增强:4麦克风线性波束范围<60°,6麦克风环形波束范围<60°,波束内外声音增强抑制比,4麦克风线性>50%,6麦克风环形>85%,其中3米识别率 > 95%,5米识别率 > 92%。

这些性能的提升,让灵云麦克风阵列产品能够更好地服务智能电视、音箱、空调、机器人、车载等智能硬件,大幅提升智能硬件的远场语音交互用户体验,并帮助客户实现快速集成,量产出货,为产品智能化落地加速。

释放双手  更完善的远场语音交互方案

为了能让智能硬件拥有“灵动双耳”,捷通华声围绕灵云麦克风阵列技术打造了一整套完善的远场语音交互方案,包括:灵云麦克风阵列SDK、灵云麦克风阵列系列评估板、完善的公有云服务,以及针对家居、家电、机器人、车载等垂直领域的定制化解决方案。

前不久,专为智能终端远场交互信号处理打造的灵云麦克风阵列SDK成功上线灵云平台(aicloud.com),随后,灵云麦克风阵列系列评估板产品也上线灵云商城。由此,灵云麦克风阵列软硬件系列产品均可在网上进行下载、购买并使用,引发智能硬件开发者广泛关注。

伴随产品的不断完善升级,灵云麦克阵列技术已经成功应用于新松、木爷等几十家服务型机器人中,以及众多智能车载产品中,并与小米、乐视等众多电视、空调智能家电厂商建立了合作。

通过不断推出并完善灵云麦克风阵列系列产品,捷通华声努力将语音识别从传统的单麦克近讲推动到多麦克远讲时代,从而让每一家智能硬件企业都能以较低的成本拥有语音识别这项入口级的技术,使得社会大众能够体验到更自然、更流畅、更贴心的人机交互。

获得 Adobe Flash Player