發(fā)表評論分享按鈕

Siri引發(fā)國內(nèi)語音產(chǎn)品開發(fā)熱潮 語音識別開智控新時代

2012/02/09

  隨著3G時代的到來,隨著科技快速發(fā)展,智能化、人性化已成為發(fā)展趨勢。蘋果Siri的推出引發(fā)國內(nèi)市場的熱潮,帶火了消費端產(chǎn)品語音控制的概念,在成功地吸引了高關(guān)注度的同時,也帶來了智能語音市場新一輪的效仿與競爭。近日,貴州大學(xué)的9名法學(xué)生研發(fā)的一款號稱“中文版的Siri”的國產(chǎn)語音助手Airi就在網(wǎng)絡(luò)上紅火了一把。Airi不僅能聽、會說,可以幽默對話,而且Airi支持中文。智能手機“又能聽又會說”功能,徹底改變了人與手機之間的交互方式,使人與手機之間的“溝通”變得更加自然方便,這將為手機行業(yè)帶來巨大變化。

  Siri讓語音控制手機成為現(xiàn)實

  蘋果Siri的流行帶火了消費端產(chǎn)品語音控制的概念,更是革新了語音識別的定義。蘋果Siri之所以讓大眾喜愛,并不是它僅僅使用語音功能,而是將語音與手機的各種應(yīng)用完美結(jié)合。

  2011年10月,蘋果發(fā)布了Siri,它通過語音大大簡化了手機操作,使iPhone 4S變身為一臺智能機器人助手;赟iri的語音系統(tǒng)成了iPhone4S創(chuàng)新性的突破,Siri功能可以讓手機用戶通過語音來對手機進(jìn)行操控,發(fā)送短信、撥打電話等功能都可以通過語音指令實現(xiàn)。

  Siri這種超越語音輸入法意義之上的語義識別工具,其準(zhǔn)確度和服務(wù)質(zhì)量取決于和使用者的磨合程度——使用的時間越長,Siri后臺捕捉到的用戶個性化偏好就越多,也就意味著Siri“私人助理”的價值是和使用時間成正比。

  不過語音識別并不是什么革命性技術(shù),早在多年前,IBM的語音識別軟件在PC上就有不錯的識別率。近年來,Google、微軟(微博)包括國內(nèi)的一些公司也投入了大量研發(fā),形成了一些相當(dāng)成熟產(chǎn)品。

  在最近的CES展會上,各個地方都可以看到語音指令和語音聽寫的早期領(lǐng)先者Nuance的身影。Nuance是支持Dragon語音識別軟件產(chǎn)品線的公司,蘋果的Siri軟件也使用該公司的聽寫技術(shù)。英特爾(微博)也在近期宣布與Nuance合作,將把語音指令技術(shù)應(yīng)用到筆記本電腦。

  Siri引發(fā)國內(nèi)語音產(chǎn)品開發(fā)熱潮

  早在2000年,比爾·蓋茨就曾提出“未來10年是語音的時代”。蘋果Siri的推出引發(fā)了國內(nèi)市場的熱潮,帶來極大的關(guān)注度,也帶來智能手機市場上,新一輪的戰(zhàn)爭。

  盡管國內(nèi)目前的語音應(yīng)用制作尚未成熟,不過從各大終端廠商爭推智能語音服務(wù)的動作來看,中文語音市場卻已開始暗流洶涌。去年12月26日,UC瀏覽器語音公測版發(fā)布,使UC瀏覽器成為全球首個使用語音智能控制的手機瀏覽器。同樣是去年12月份,騰訊推出了支持語音搜索功能的S60V5手機QQ瀏覽器2.7版,這次無疑是又一力作。

  國內(nèi)知名的瀏覽器廠商UC優(yōu)視,當(dāng)時推出了其最新的UC瀏覽器8.2 Android版,并且率先在手機瀏覽器中加入了語音助理功能,實現(xiàn)了語音控制與語音搜索。

  騰訊日前發(fā)布的全面智能語音控制手機瀏覽器可以通過語音進(jìn)行多項智能操控,使用普通話就可以直接打開各大網(wǎng)站,獲取搜索結(jié)果,并且還支持通過語音調(diào)出“書簽”、“歷史”、“添加書簽”、“設(shè)置”、“退出”等一系列手機瀏覽器的常用操作。據(jù)騰訊手機QQ瀏覽器相關(guān)負(fù)責(zé)人介紹,除了手機瀏覽器,騰訊自主研發(fā)的“智能語音識別技術(shù)”還被用于手機SOSO地圖、手機SOSO客戶端等多個產(chǎn)品中。此外Airi、Ciriis等國產(chǎn)中文語音應(yīng)用目前也已悄然搶灘中國市場。

  艾媒咨詢分析師表示,隨著消費者對語音技術(shù)認(rèn)識的加深,這個行業(yè)正在迎來蓬勃發(fā)展的時間窗口。

  語音操控應(yīng)用全面普及尚需時日

  蘋果Siri的流行帶火了消費端產(chǎn)品語音控制的概念。在美國拉斯維加斯舉行的國際消費電子產(chǎn)品展會上,從汽車到電視,幾乎各類產(chǎn)品都整合了語音控制功能。隨著設(shè)備具有語音和手勢功能,汽車將成為這種設(shè)備。在CES展會上,奧迪展示了為其汽車提供的新的手勢驅(qū)動的界面。奔馳介紹了一直名為DICE(動態(tài)和直觀控制體驗)的新的集成的沖擊系統(tǒng)。未來語音控制功能還會應(yīng)用到從電視到安防等幾乎各類產(chǎn)品。

  消費者在體驗手機的同時,在手機中加入語音控制系統(tǒng),滿足了消費者使用上新鮮感,但也存在一些問題。首先,語音服務(wù)功能本身仍存在著技術(shù)改進(jìn)。雖然語音控制技術(shù)多年前就已現(xiàn)身,但語音識別的精確度仍有待提高,就如蘋果Siri在語音識別上也尚待完善。從語音識別到執(zhí)行聲控命令,這是一個極其復(fù)雜的過程,出錯率較高。

  其次,通過聲音來控制電子設(shè)備,似乎面對強大的阻力,很難成為主流。由于人們在不同的場所使用操作電子設(shè)備,因此聲音的公開性,天然限制了語音識別應(yīng)用的場景和環(huán)境,給語言識別帶來了一定的限制。

  因此,隨著消費者對語音技術(shù)認(rèn)識的加深,相信在未來發(fā)展過程中,廠商仍應(yīng)加強語音操控功能的技術(shù)完善。另外,廠商還應(yīng)提升用戶的綜合體驗,給用戶帶來新鮮瀏覽體驗的產(chǎn)品,以便滿足多樣化的用戶需求,贏得更多消費者,從而或鞏固、或進(jìn)攻市場。

  智能語音應(yīng)用真正意義上拉近了終端與消費者的距離,實現(xiàn)終端智能化的歷史性的跨越。未來必將開辟智能控制新時代。

通信信息報



相關(guān)閱讀:
傳蘋果與加拿大運營商商討iTV合作計劃 2012-02-08
蘋果Siri中文版有望下月推出 語言擴展至更多國家 2012-02-08
蘋果商店封殺360手機應(yīng)用 騰訊金山同時“中槍” 2012-02-07
蘋果獲首個iPhone定位追蹤技術(shù)專利 2012-02-01
傳蘋果正計劃研發(fā)iPhone移動支付系統(tǒng) 2012-02-01

熱點專題:  語音合成TTS 語音識別ASR