您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

語音控制開發(fā)之旅,能不能“說走就走”?

2019-12-27 10:07:50   作者:   來源:“安富利”微信公眾號   評論:0  點擊:


  三年前的2016年,互聯(lián)網(wǎng)女皇瑪麗•米克爾在其年度《互聯(lián)網(wǎng)趨勢》報告中曾經(jīng)預(yù)測,人機交互即將迎來新一輪的變革,而語音將成為人機交互的新范式。從那以后,本來已經(jīng)蠢蠢欲動的智能語音市場就真的應(yīng)聲“火”了起來。
  這把“火”究竟有多旺,我們可以從三個方面直觀地感受出來:其一,就是眾多互聯(lián)網(wǎng)巨頭在語音處理領(lǐng)域的積極投入;其二,是2017年之后以亞馬遜Echo為代表的智能音箱單品的火爆;其三,是類似Siri的語音助手功能在智能手機中滲透率越來越高。種種跡象都在告訴我們,智能語音相關(guān)的生態(tài)鏈正在逐漸成熟,基于智能語音的相關(guān)應(yīng)用遲早有一天會成為眾多智能產(chǎn)品的標(biāo)配,比如說在智能家居等應(yīng)用中的語音控制功能。
  當(dāng)然,想做率先“吃螃蟹”的人,也就必然會面臨著一系列需要跨越的“坑”。具體到智能語音控制領(lǐng)域,這樣的“坑”主要來自三個方面:
  首先是成本。因為成本是任何一種技術(shù)大規(guī)模普及的重要前提,特別是當(dāng)我們考慮到要將語音控制功能集成到不同的嵌入式設(shè)備中去,真正做到讓語音“無處不在”的時候,成本的壓力會更為突出。
  其次是缺乏整體解決方案。畢竟,對于新技術(shù)來說,完整成熟的參考設(shè)計方案會比較“罕見”。如果有,對于開發(fā)者來說將是真福利。
  再有就是如何順利接入語音處理引擎。眾所周知,智能語音控制應(yīng)用背后都會與一個云端的語音處理引擎相連,如亞馬遜的Alexa、科大訊飛開發(fā)語音平臺等,這其中有不少繁復(fù)的測試認(rèn)證過程。
  上面這三個制約因素也決定了語音控制方案開發(fā)之旅并不是一場“說走就走”的旅行,在此之前開發(fā)者免不了要做大量準(zhǔn)備工作。
  不過現(xiàn)在,情況不一樣了,因為下面這個由恩智浦開發(fā)的方案(見圖1),打破了以往的制約。在這個面積為30mmx40mm超小型電路板中,幾乎覆蓋了嵌入式語音識別所有的性能和功能需求,讓困惑開發(fā)者的難題迎刃而解。
圖1.基于恩智浦i.MX RT跨界處理器的語音控制方案(圖片來源:NXP)
  基于MCU的設(shè)計
  這個方案最鮮明的一個特點就是,其主控芯片采用的不是微處理器,而是一顆‘MCU’——恩智浦的i.MX RT跨界處理器。之所以稱為“跨界”,是因為一方面i.MX RT采用了主頻高達(dá)600MHz的Arm Cortex-M7內(nèi)核,性能甚至比普通的Cortex-A5都高一倍;而另一方面,其在成本和功耗方面又能夠與MCU看齊,而且繼承了MCU的開發(fā)工具鏈,使得以前熟悉MCU的開發(fā)者都能夠很快上手。正是因為這種“魚和熊掌”兼得的特性,i.MX RT一經(jīng)推出就受到了開發(fā)者的青睞。
  此番將i.MX RT引入到語音控制領(lǐng)域,根據(jù)恩智浦的估算,與以往基于微處理器的解決方案相比可以將總系統(tǒng)成本減少一半以上。這也使得這個基于MCU的語音控制方案極具競爭力。
圖2.i.MX RT106A跨界處理器系統(tǒng)框圖(圖片來源:NXP)
  整體解決方案
  該方案中使用的跨界處理器的型號是i.MX RT106A,它是通用的i.MX RT1060產(chǎn)品中的一個特殊型號,專門針對基于云端的嵌入式語音應(yīng)用進行了優(yōu)化,特別是可授權(quán)使用恩智浦完整的語音助手軟件解決方案,包括低延遲,遠(yuǎn)場“喚醒字”檢測、噪聲抑制、回聲消除和語音打斷功能等一系列特性。這顯然會令開發(fā)事半功倍,也讓整個系統(tǒng)的BOM更為簡化。
  除了核心的主控芯片,整個基于i.MX RT的語音控制解決方案中還包括其他一些關(guān)鍵元器件,如TFA9894D智能音頻放大器和可選的A71CH安全元件,以及一個完整的參考BOM,可為客戶提供了一個從硬件到軟件的完整的交鑰匙解決方案。
圖3.i.MX RT語音控制方案硬件框圖(圖片來源:NXP)
  與Alexa連接
  特別值得一提的是,該方案還可無縫連接Amazon Alexa語音服務(wù)(AVS)平臺,與AVS認(rèn)證軟件、安全性和入門使用完全整合,大幅減少了植入Alexa所需的工程投資,縮短語音控制產(chǎn)品的上市時間。為此,恩智浦還在美國設(shè)置了實驗室,專門為內(nèi)置Alexa的產(chǎn)品提供測試服務(wù),幫助客戶通過亞馬遜的最終評估。
  實際上這種增值服務(wù)模式,也是亞馬遜等語音處理平臺提供商所樂見的,因為這有利于其平臺形成一個更完善的應(yīng)用生態(tài)系統(tǒng),是一個雙贏的結(jié)果。所以我們也可以想見未來類似的服務(wù)會被復(fù)制到與其他智能語音處理平臺的合作中。
圖4.i.MX RT語音控制方案與AVS整合框圖(圖片來源:安富利)
  總之,這個基于MCU的語音控制解決方案為開發(fā)者提供了一種“即插即用”式的開發(fā)體驗,無論是從硬件、軟件,還是與語音處理平臺功能的整合,都能快速搞掂。如果你想在自己的嵌入式產(chǎn)品中加入智能語音處理功能,現(xiàn)在可以“說走咱就走”了。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)