AI语音识别狂潮来袭 MEMS麦克风/DSP全力备战

AIoT与智能语音结合,为「声控」市场揭开争夺战序幕。 2018年可看到智能语音技术大举进入各种类型的终端装置,包含手机、智能音箱、穿戴式装置,甚至是汽车应用平台等,刺激MEMS麦克风、语音处理器,以及各种感测组件的需求爆发。

 


运算力效能明显提升, 激发专用型语音DSP需求


Cadence亚太区IP销售总监陈会馨(图1)表示,AI语音识别需求急速攀升,带动IP相关产品的询问度与订单快速增加,同时也造成应用处理器(AP)设计产生改变,催生专用型语音DSP设计当道。



图1 Cadence亚太区IP销售总监陈会馨表示,专用型语音DSP有助于提升AP运算能力。

陈会馨谈到,早期智能音箱发展起飞时,内部大多采用ARM为基础的CPU架构,但从2016年开始,许多芯片商为了满足智能语音识别处理所需的效能,开始研发专用的语音处理芯片,也开始导入语音DSP在其中。 追根究柢,导致芯片设计改变,主要原因在于「运算能力需求的增加」。


众所皆知,在智能语音识别过程中,首先须要对进来的语音做前处理,此处理过程包含多麦克风数组、远场、波束增强、噪音消除等功能,这些技术对于在地端的运算能力有庞大要求,促使语音DSP技术于近两年发展快速。 换言之,过去可能是单一信道处理技术,如滤波的技术,演变至今,有许多神经网络技术也开始导入其中。


陈会馨指出,现有许多噪音辨识乃是透过人工智能学习算法,对原始数据进行分类,进而了解数据内部结构,该技术称之为非监督式学习(Unsupervised Learning Network)。 这种算法的引进,对于芯片硬件的运算能力要求将会比过去AP芯片的要求高出许多,若采用旧有AP芯片技术,将难以满足此类型技术的运算能力需求。


陈会馨分析,过去AP设计大多并未导入DSP设计,仅采用ARM基础的CPU架构。 虽然仍有部分厂商采用通用型DSP进行讯号处理,但相较于一颗专为语音识别量身打造的语音DSP,后者能采取较低的工作频率,完成AI语音所需的工作运算能力与技术规格要求,对于语音处理的效能也将相对提升。


满足低功耗/高整合度 DSP+MEMS麦克风齐抬轿


楼氏智能语音事业处高级产品管理总监王宇飞(图2)强调,已有越来越多语音处理器,内建AI机器学习(ML)算法,尤其是深度学习网络的加入,带来高达10倍以上的运算需求,这也让原本看似不重要的功耗效率问题逐渐受到重视。 简言之,在大量运算的过程中,功耗不能瞬间提升太多,否则将可能导致温度升高,进而影响处理性能



图2 楼氏智能语音事业处高级产品管理总监王宇飞指出,AI运算量不断扩增,使低功耗设计要求日益攀升。


楼氏(Knowles)中国区产品管理消费电子事业部副总裁暨中国区董事总经理陆文杰(图3)表示,低功耗性能取决于整体系统设计,也意味着前段MEMS麦克风的音频搜集,到后期处理的设计皆环环相扣。 也基于此,楼氏整合既有的MEMS麦克风技术与低功耗DSP推出高整合度、低功耗的智能麦克风方案。



图3 楼氏中国区产品管理消费电子事业部副总裁暨中国区董事总经理陆文杰谈到,该公司智能麦克风方案可协助厂商降低整合成本。


王宇飞认为,该款智能麦克风方案在低功耗的效能表现十分优秀,从楼氏自我产品测试结果来看,目前已可以透过单麦克风进行语音唤醒,其功耗水平达2毫瓦以下。 针对需要搭载电池的AI语音应用相关装置,如智能手机、穿戴型应用设备,将有效延长其产品续航力,同时满足智能化语音应用需求。


据了解,楼氏所推出的DSP结合MEMS麦克风的整合方案,已相继导入Vivo、OPPO等智能型手机旗舰机种,同时也与百度DuerOS合作SmartMic耳机开发工具包。


陆文杰表示,该公司是第一家推出这种全方位智能型麦克风整合方案的厂商,其技术能量来自于楼氏本身的MEMS麦克风、DSP、算法与软件开发能力。 从开发商的角度而言,成本一直是产品设计考虑的关键重点之一,相较于本身仅有MEMS麦克风技术能力的厂商来说,DSP+MEMS麦克风整合方案,将有助于降低「整合成本」的问题,也就是说开发商无须耗费人力与时间钻研各组件之间的整合,可将心力着重在提升整体产品性能或差异化的特点上。


二合一传感器加持, 强化语音装置精准度


不过针对DSP+MEMS麦克风的整合型方案,意法半导体(ST)亚太区产品营销经理陈建成(图4)则提出另外一种看法。 他谈到,各种搭载语音识别物联网装置出货量逐渐提升,带动MEMS麦克风的需求增加,然而MESM麦克风市场价格却不断下降,如何提升MESM麦克风价值,同时兼顾其辨识能力,将是重点所在。



图4 意法半导体亚太区产品营销经理陈建成表示, MEMS麦克风结合加速计将有助于提升辨识精准度。


陈建成指出,很多智能型语音应用装置,设置于一些会产生振动的环境之中,例如蓝牙耳机应用,消费者可能在走路的过程中听音乐,或进行语音控制,故若结合加速计与MEMS麦克风,将使装置更清楚得知讯息,强化情境精确度。


目前来说,陈建成表示,加速器与MEMS麦克风整合的需求大多在智能家庭与智能工厂的应用情境中,但若要实现AI语音控制的能力,最重要的环节是算法开发部分,以传感器的角色,关键还是在于精确搜集有利于后段辨识的环境数据数据。


从应用市场角度分析,汽车应用将有望成为继智能音箱后,下一个AI语音蓝海市场。 AMS台湾区总经理李定翰(图5) 表示,在驾驶汽车过程中,驾驶者的目光与双手皆须为了操控汽车而有所限制,在这种情况下,最需要语音来代替双手,进行控制车内环境与导航。



图5 AMS台湾区总经理李定翰认为,汽车应用导入AI 语音助理商机值得期待。


也基于此,看好车用市场的发展潜力,AMS本身的MEMS麦克风产品已通过ACQ-100车规认证,待AI语音车用市场起飞之时大举抢进。 同时,ST亦计划推出车规MEMS麦克风系列,预计2019年将会看到相关产品。


生产制程易卡关, MEMS麦克风挑战大


值得一提的是,李定翰认为,目前MEMS麦克风技术变化不大,重点在于维持既有的精准性、缩小尺寸,以及在量产时能达到产品的一致性的要求。 虽然语音识别的发展,进一步带动MEMS麦克风的需求,但生产制程的良率管理,也成为相关供应链厂商一门难解的课题。


鑫创科技市场营销部经理曾建统(图6)表示,AI语音发展趋势规格目前呈现两极化的发展,针对较成熟的消费型应用产品(如手机、笔电与耳机),现有的MEMS麦克风性能皆已可满足其应用需求,但另一方面,对于MEMS麦克风的灵敏度、 收音与抗噪有更高要求的AI应用(如智能音箱类型产品),则对MEMS麦克风技术规格要求更严苛。换言之,面对这两种截然不同的应用,MEMS麦克风除了技术规格有提升的必要,同时也须在既有产品与技术规格下,考虑提升产品良率的技术。



图6 鑫创科技市场营销部经理曾建统指出,良率将成为MEMS麦克风发展关键要素。


曾建统谈到,该公司看到许多语音应用产品,在生产过程中的不良率问题经常在MEMS麦克风组件的节点中被突显出来。原因在于,相较于其他类型的感测组件,MEMS麦克风的组件特性更为脆弱,不适合用水洗或吹风的方式进行处理。 不过为了响应产品整体的轻薄短小与高性能的需求,开发商追求更高阶制程,而新型态的生产过程,却与MEMS麦克风本身的组件特性经常背道而驰。 再者,受限于MEMS麦克风本身价格低廉的因素,生产者是否希望透过制程改进MEMS的良率问题,也是一个须考虑的因素。


随着消费型产品在轻、薄、短小的要求下,开发商需要透过制程的改善,进而满足产品机构上的要求,也基于此,PCB板上的MEMS麦克风,经常成为容易出错的问题点。 举例说明,水洗、喷发气体与压力变化都会对麦克风良率产生影响,然而有些新制程为了清除传感器上的杂质,采用水洗的制程做清洗的动作;此外,也有些制程于真空环境中生产,当生产完毕时,产品就会进入破真空的阶段,过程中会产生一些压力变化,进而影响麦克风的良率


不仅如此,由于产品对于静电放电(ESD)要求越来越严苛,因此系统产品在测试ESD过程中,需要拿静电枪对各个接口发射静电测试,而MEMS麦克风组件又经常摆放于开口处,也容易使得MEMS麦克风组件受到影响。


整体而言,曾建统分析,ESD的防护是系统层面的问题,需要提供厂商生产、制程上的协助予以克服。 但从另外一个层面来看,上述提到的系统产品开发问题,单纯从表面上看到的是MEMS麦克风造成良率的影响,但这背后某种程度也是MEMS麦克风厂商所面临的一大瓶颈。


陈建成表示,未来MEMS麦克风使用将愈趋普遍,甚至可能会成为标配选项,因此麦克风良率变差,将会引发很大的设计难题,也基于此该公司在台北设立麦克风实验室,协助厂商进行麦克风测试、颁发测试证书等。


整体而言,目前台湾IC设计商尚未在MEMS麦克风市场中受到Tire 1开发厂关注或合作的主要原因在于,即便台湾MEMS麦克风厂商可以满足开发商规格上的要求,但在生产良率的要求,比起一般国际大厂则较为不足,故如何协助开发商提升良率问题,将成为未来拿下AI语音庞大商机关键要素。


来源于:《新通讯元件杂志

    发送中

    微信扫一扫
    关注该公众号