首頁>>>技術>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

發(fā)表評論分享按鈕

神奇的語音技術 丟掉你的鍵盤擁抱語音搜索

2011/09/07

  有沒有想過不論是手機還是電腦,都可以丟開鍵盤或鼠標,只要大聲對搜索引擎說出你想要的,就能得到答案?下一代搜索技術之一“語音搜索”,能夠幫你實現(xiàn)這些愿望。

  谷歌的語音搜索

  在兩個月前亞太地區(qū)的“移動革命”大會上,谷歌工程師對著手機說“World Cup Soccer 2011”,顯示的是關于這次女足世界杯比賽的信息,你會發(fā)現(xiàn),日本女足取得了世界杯冠軍;他又對著手機說“東京玩具商店地圖”,則真的出現(xiàn)了一張標注了玩具商店地址的谷歌地圖。這就是谷歌最新的語音搜索技術。

  6月14日,谷歌針對PC也發(fā)布了這一技術。谷歌并沒有把手機語音搜索功能簡單地移植到桌面,PC版語音搜索更為接近自然用戶界面,而這種界面也是計算機開發(fā)者幾十年來不斷的追求。PC版語音搜索與智能手機版差別不大。與輕拍手機屏幕的話筒圖標不同,用戶可在Chrome瀏覽器中點擊www.google.com搜索框的話圖標。當然,用戶需要把電腦連接話筒,或者佩戴耳麥。語音搜索可識別覆蓋全球約50億人的27種語言和方言,但用戶界面目前還只有美式英文一種版本。8月25日,谷歌地圖也發(fā)布了語音搜索功能鍵,用戶可以直接用語音進行地點查詢。據(jù)悉,此項新增服務是在6月發(fā)布的谷歌語音搜索的補充,用戶可以通過計算機麥克風錄入自己的目的地,進行地圖搜索。該設計的目的是為了簡化地圖搜索,比如要查找一條名字拼寫繁瑣的街道,用戶就可以采取語音輸入的方式,只需要說明“從A地到B地”。

  “谷歌想要消除橫亙在用戶和想尋求的信息之間的所有障礙。具體到語音搜索,我們的目標是讓用戶隨時隨地能夠使用語音識別技術,只要需要打字的地方,都可以用說話來代替。”谷歌語音搜索研究科學家Pedro Moreno在接受《電腦報》記者采訪時表示,因為手機鍵盤和屏幕都很小,并且在觸摸屏上很容易打錯,打字會比較困難。但通過語音搜索,用戶可以不再被這些問題所困擾,只需說出想要找的內(nèi)容,就可以簡單、快速地進行搜索。這對于那些輸入困難的語言尤為重要,比如中文、韓語、日語、希伯來語、阿拉伯語等。

  據(jù)了解,相比傳統(tǒng)輸入,語音搜索功能可以容納更長的拼讀內(nèi)容。Google語音搜索還有一項有趣的功能,當用戶拼讀算術題時,Google可以迅速提供計算結果。不過,目前,谷歌的語音搜索產(chǎn)品還并不是很成熟,辦公室、室外等嘈雜的環(huán)境會影響它的搜索結果。

  無障礙搜索的愿景

  自電腦誕生以來,讓電腦聽懂人們的說話,一直是IT從業(yè)者的一大心愿。在單機時代,IBM是最早進行語音識別技術研究的企業(yè),在上個世紀90年代就推出可用于聲控打字和語音導航的語音識別輸入軟件IBM ViaVoice VIA。用戶只要對著電腦講話即可輸入漢字,輸入速度能達到150個漢字,幾乎是鍵盤輸入的2倍、普通手寫輸入的6倍。盡管售價不菲,但這套軟件在全球已售出100多萬套。漢王科技當年正是基于這套軟件,開發(fā)出了基于語音和手寫識別的手持設備。

  在比爾·蓋茨預測的未來十年最重要的技術進步中,語音識別技術位居首位。微軟則從Windows XP開始,在操作系統(tǒng)中添加了語音識別功能,在新推出的Windows 7里這一功能更為完善。不用鍵盤鼠標,用戶可以通過語音對計算機進行簡單的控制,如說一句“打開瀏覽器”,就可以輕松地打開IE。而Exchange Server 2010中則有更加先進的語音郵件預覽功能,可以自動為語音郵件提供文本預覽。不方便收聽語音郵件的情況下用戶可以先通過語音郵件預覽來了解郵件的大致內(nèi)容,也可以通過閱讀文本預覽來決定郵件的優(yōu)先順序。

  不過,真正讓語音搜索為人們所知和應用的還是在手機上的嘗試。手機的演化也為語音搜索的實現(xiàn)提供了硬件基礎,F(xiàn)在幾乎所有手機都擁有錄音、照相等功能,智能手機的出現(xiàn)則讓手機從一個單純的通話裝置變成一臺小型的計算設備。

  越來越多的公司意識到,移動搜索領域會呈現(xiàn)與互聯(lián)網(wǎng)搜索截然不同的人機交互方式。早在2008年,谷歌在美國發(fā)布了英文語音搜索服務Voice Search,應用于Android、諾基亞(微博)S60、黑莓、iPhone等多個系列的手機。據(jù)Pedro Moreno介紹,從那時起,谷歌已經(jīng)將語音識別擴大到Android手機的每一個應用程序的每一個文字輸入欄。

  谷歌的競爭對手微軟也早早地進行了布局。2007年,微軟收購了領先的手機語音識別服務廠商TellMe,組成了微軟現(xiàn)在的語音團隊,TellMe為包括411商務搜索、1-800-555的信息搜索以及美國航空在內(nèi)的企業(yè)提供語音平臺。微軟新的語音團隊最大的任務就是把語音搜索技術與Windows Mobile整合起來,移動版Bing搜索在三星(微博)手機上已經(jīng)實現(xiàn)與谷歌類似的語音搜索功能。

  蘋果也在布局語音搜索這個領域。2010年4月蘋果收購了手機語音搜索廠商Siri。不僅如此,它和語音識別廠商Nuance也保持著密切聯(lián)系。之前業(yè)界流傳,在iOS5中有望加入類似于語音轉文字或語音導航等高端功能。

  近日,騰訊手機SOSO V1.0(安卓版)正式上線,而語音搜索功能是該軟件的亮點,用戶只要說出搜索信息,即能立即進行搜索,大大簡化了手動輸入的操作流程。而前不久騰訊公司限量發(fā)售的小Q機器人產(chǎn)品也運用了“語音搜索”功能,相關負責人在接受本報記者采訪時表示,集成語音搜索的小Q機器人產(chǎn)品未來希望能夠在很大程度去替代傳統(tǒng)的鼠標和鍵盤,成為人們上網(wǎng)的新助手。

  不過,手機搜索絕對不是終極目標,語音搜索功能將延伸為語音輸入,覆蓋到手機、電腦等各種終端上。

  “過不了多久,關鍵詞搜索將會成為像電動打印機和黑膠唱片一樣的懷舊產(chǎn)品,寄托人們對往昔時光的回憶!泵绹A盛頓大學計算機科學家奧倫·埃奇奧尼日前撰文稱,更好的搜索技術將能夠支持語音搜索,并對輸入的問題直接做出響應,或者是用自然的語言進行搜索并獲得答案,而不是像現(xiàn)在這樣使用索引來實現(xiàn)。

電腦報



相關閱讀:
新世界的移動互聯(lián)2.0 2011-08-31
移動互聯(lián)網(wǎng)成未來“主角” 2011-08-30
運營商不甘“被邊緣” 謀局移動互聯(lián)網(wǎng)平臺 2011-08-29
資本青睞無線市場 移動業(yè)務融資易成業(yè)難 2011-08-29
國內(nèi)互聯(lián)網(wǎng)創(chuàng)業(yè)潮遭遇資本寒流:誰是幸存者 2011-08-29

熱點專題:  語音合成TTS 語音識別ASR    移動互聯(lián)網(wǎng)
分類信息:  移動互聯(lián)網(wǎng)_與_移動  移動互聯(lián)網(wǎng)_與_互聯(lián)網(wǎng)  移動_與_互聯(lián)網(wǎng)