泉声电子董事长温增丰表示,利用语音指令来控制电子产品,对用户来说,是*自然的人机接口。 但要让机器设备清楚地听到指令,背后涉及许多声学上的专业。
在家庭环境中,其实存在着许多背景噪音,麦克风本身也有底噪。 要避免这些噪音盖过用户所发出的语音指令,可分成两个层次来谈。 针对外部的背景噪音,硬件制造商可透过多颗麦克风组件搭配噪声消除算法,来消除用户以外的杂音。 这部分涉及麦克风制造商及语音处理器的搭配。 至于麦克风的底噪,则要看电声组件业者的功力,以及所选用的麦克风设计架构。
一般来说,驻极体麦克风(ECM)的讯噪比(SNR)是*好的,可达70dB以上。 截至目前为止,专业录音室所使用的麦克风,基本上都还是ECM的天下。 不过,微机电(MEMS)麦克风的讯噪比近年来也有显著改善,目前业界的水平可以做到64~65dB,与ECM的差距正在拉近。
不过,ECM有一个先天的缺点,就是采用数组式设计时,ECM麦克风模块的组装加工较为困难,MEMS则没有这个问题,在大量生产时,加工相对简便。 不过,MEMS麦克风先天上对低频的反应不如ECM麦克风,这也是应用开发商在选择麦克风组件时,必须特别注意的。
因此,温增丰总结指出,就智能扬声器应用来说,未来应该会是以MEMS麦克风为主流。 毕竟,在采用数组式架构的前提下,MEMS麦克风有很明显的优势。 目前市面上的智能扬声器,绝大多数都是采用数组式麦克风,例如中国科大讯飞和电商平台京东联合成立的灵隆科技,便推出了采用五颗麦克风的叮咚音箱;亚马逊的Echo则内建七颗麦克风(图3);Google Home则只有两颗。 虽然声音接收效果与麦克风的颗数未必成正比,但就智能扬声器应用来说,单一麦克风**是不够的。