首頁>>>技術(shù)>>>語音應用>>>語音識別(ASR)  語音識別產(chǎn)品

消息稱蘋果正研發(fā)iPhone語音識別技術(shù) 可撰寫郵件

2009/08/31

  北京時間8月29日,據(jù)國外媒體報道,據(jù)一份專利文件顯示,蘋果正在為iPhone和iPod研發(fā)語音識別技術(shù)。隨著手機體積越來越小,語音識別技術(shù)日益成為數(shù)據(jù)輸入的關(guān)鍵。

  媒體在該專利文件中發(fā)現(xiàn)了一個利用語音識別技術(shù)撰寫郵件的結(jié)構(gòu)圖。蘋果的專利文件中包含大量術(shù)語,不過業(yè)內(nèi)人士解讀稱,這種語音識別技術(shù)不僅可以將用戶語音信號識別成為文字,甚至可以處理標點符號等非語音數(shù)據(jù)。同時,根據(jù)蘋果的專利文件,該語音識別模塊是一個專門為此配置的獨立芯片或類似的硬件設(shè)施,類似于視頻采集卡從電腦主服務器上加載圖象。如果蘋果真能實現(xiàn)這一技術(shù),那么iPhone必能進一步拓展其在智能手機領(lǐng)域的市場占有率。

  事實上,此前已有其它公司進行過語音轉(zhuǎn)換為文本的嘗試。最基本的語音識別技術(shù)就是可以通過語音拔號。其中,微軟曾開發(fā)過一款名為Voice Command的工具,例如用戶只需說出“拔打約翰的電話”,手機就會自動在聯(lián)系人列表中搜索約翰的號碼并拔號。用戶無需提出錄入這些語音,可以直接使用。同時,用戶還可以通過語音詢問時間、電池電量、信號強度、日程安排等。不過Voice Command的使用范圍有限,它無法撰寫郵件,而且如果任務超過十余項,Voice Command也無法識別。

  數(shù)年前,微軟董事長比爾·蓋茨(Bill Gates)曾演示過一個Pocket PC的語音識別和文字錄入功能,其效果非常好,但在這一轉(zhuǎn)換過程中,語音數(shù)據(jù)先被轉(zhuǎn)換為數(shù)字,之后通過一臺強大的服務器進行無線傳輸,實現(xiàn)了語音到文字的轉(zhuǎn)換。目前這種方法并不實用。

騰訊科技



相關(guān)鏈接:
開源的語音識別軟件Simon 0.2發(fā)布 2009-08-28
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14
科大訊飛嵌入式語音新產(chǎn)品發(fā)布會9月3日召開 2009-08-12
Nuance攜手IBM提供先進的語音識別解決方案 2009-08-05