首頁 > 新聞 > 國際 >

Audience林明璋:明年中高端手機(jī)智能語音將普及

2014-12-01 09:58:09   作者:宿藝   來源:搜狐IT   評論:0  點(diǎn)擊:


  在蘋果發(fā)布Siri之后,互聯(lián)網(wǎng)巨頭與硬件企業(yè)就已在智能語音領(lǐng)域展開了新的爭奪戰(zhàn)。此前,平臺級的語音助手應(yīng)用以蘋果Siri、谷歌GoogleNow為主,現(xiàn)在微軟也在Windows Phone 8.1中集成了Cortana,加入到競爭中來。本月中旬,微軟發(fā)布的視頻廣告中,其智能語音助手Cortana就對蘋果Siri進(jìn)行了嘲弄。視頻中Cortana向Siri自夸它能完成一些高級的交互功能,而Siri不能。

  在中國市場,科大訊飛、百度、騰訊等互聯(lián)網(wǎng)企業(yè),中興、華為等手機(jī)企業(yè)今年來也紛紛加大對智能語音領(lǐng)域的投入。那么,國內(nèi)智能語音產(chǎn)品如何實(shí)現(xiàn)硬件與軟件結(jié)合,何時能面向大眾市場實(shí)現(xiàn)商業(yè)化?語音處理芯片公司Audience中國區(qū)總經(jīng)理林明璋近日就此問題接受了《壹觀察》專訪。以下為主要信息點(diǎn):

  Audience是誰?

  Audience公司基于人體聽力學(xué)的原理開發(fā)出一種名為earSmart的智能語音處理模塊,它能讓用戶在嘈雜的環(huán)境中進(jìn)行清晰的對話。主要向設(shè)備制造商銷售芯片和授權(quán)知識產(chǎn)權(quán),通過過濾背景噪音以提高移動設(shè)備的語音質(zhì)量。

  2008年,該公司的第一款語音處理芯片被應(yīng)用于手機(jī)上。2012年5月Audience在納斯達(dá)克上市。蘋果在iPhone4中開始使用Audience公司的語音處理芯片,蘋果iPhone4S的A5芯片也集成了該芯片模塊,以提高蘋果語音助手Siri的識別能力。

  目前,Audience的主要客戶包括三星、中興、華為、小米、HTC等主要手機(jī)廠商,同時在Audience也在拓展智能汽車、智能家居等市場。

  目前智能語音發(fā)展中遇到的主要問題

  1、智能喚醒功能,目前產(chǎn)品使用體驗(yàn)都不是很好,喚醒率和準(zhǔn)確度有待提高,喚醒后的智能語音執(zhí)行也需要大幅優(yōu)化;

  2、嘈雜的場合需要提高聲音降噪功能,如高速汽車、家居環(huán)境中超過5米的遠(yuǎn)距離語音識別等;

  3、市場上所稱的聲紋識別功能,需要提高對特殊語音與關(guān)鍵詞識別。

  目前與中國企業(yè)合作進(jìn)展

  Audience目前與中國主要的手機(jī)廠商都有合作,如華為D1、小米2、中興“星星一號”、魅族MX4 Pro等都使用了Audience的語音處理芯片。

  今年9月,Audience與中興通訊、百度、高德、Nuance、中國科學(xué)院成立了“智慧語音聯(lián)盟”,這是世界上的第一個移動設(shè)備聲控技術(shù)聯(lián)盟。林明璋稱,成立“智慧語音聯(lián)盟”的目的在于推動智能手機(jī)從“觸控”向“聲控”邁進(jìn)。

  除終端廠商外,中國移動與Audience在VoLTE高清語音、提高通話質(zhì)量等方面也有合作。

  林明璋對《壹觀察》表示,中國終端廠商中與Audience合作最為密切的是中興通訊與魅族。魅族剛剛發(fā)布的MX4 Pro產(chǎn)品就內(nèi)置了Audience的語音處理方案。而中興通訊與Audience的合作時間最長,中興在三年前已開始進(jìn)行智能語音的研發(fā),其首款主打智能語音的“星星一號”手機(jī)在與Audience聯(lián)合研發(fā)后,通過VoiceQ等技術(shù)已經(jīng)具備了智能語音的常用功能。

  如何應(yīng)對中國企業(yè)“仿制”?

  林明璋認(rèn)為,智能語音與拍照軟件相比需要更大的投入,涉及到更復(fù)雜的應(yīng)用場景和算法,因此在短時間內(nèi)被迅速仿制的可能性不大。國內(nèi)終端企業(yè)與Audience合作要牽扯到芯片選型、硬件與軟件適配、UI優(yōu)化、麥克風(fēng)選擇、版型設(shè)計(jì)等諸多環(huán)節(jié),一個細(xì)節(jié)出了問題往往會發(fā)生非常大的偏差,因此被簡單復(fù)制的難道會相當(dāng)大。

  林明璋透露,Audience近期將與中興發(fā)布一款智能語音手機(jī),搭載了不間斷偵測智能語音和音頻解決方案Audience eS700系列處理器,并應(yīng)用了其VoiceQ和MotionQ兩大功能。VoiceQ使移動設(shè)備處于‘永在聆聽’模式,可延長電池使用時間。MotionQ技術(shù)可以直接連接到移動和位置傳感器,支持多達(dá)10軸加速度計(jì)、陀螺儀和磁強(qiáng)計(jì),不必直接與AP連接。當(dāng)設(shè)備自身發(fā)生方向變化時,通過使用慣性傳感器數(shù)據(jù)優(yōu)化麥克風(fēng)的性能,提高智能語音的識別能力,同時達(dá)到超低功耗,提供最好的用戶體驗(yàn)。

  智能語音將擴(kuò)展至穿戴設(shè)備與智能家居

  林明璋認(rèn)為,隨著物聯(lián)網(wǎng)與移動技術(shù)發(fā)展,語音將成為未來智能家居的核心,而通過智能語音完成智能家居終端之間的鏈接控制,可以將用戶的雙手解放出來。而聲紋和傳感器技術(shù)的進(jìn)步,智能語音將成為穿戴設(shè)備的主要控制方式,語音識別技術(shù)的應(yīng)用范圍和場景將會無限放大。

  林明璋表示,從產(chǎn)業(yè)鏈來看,巨頭們2014年開始全面發(fā)力智能語音,而2015年將成為智能語音在硬件與軟件結(jié)合發(fā)展的關(guān)鍵一年,預(yù)計(jì)中國市場高端旗艦產(chǎn)品將全部具備智能語音功能。

分享到: 收藏

專題