您當(dāng)前的位置是:  首頁 > 新聞 > 國際 >
 首頁 > 新聞 > 國際 >

微軟語音識(shí)別出錯(cuò)率達(dá)5.1%創(chuàng)新低

2017-08-21 14:06:59   作者:   來源:鳳凰網(wǎng)   評(píng)論:0  點(diǎn)擊:


微軟語音識(shí)別出錯(cuò)率達(dá)5.1%創(chuàng)新低
  據(jù)科技博客TechCrunch北京時(shí)間8月21日?qǐng)?bào)道,微軟公司在當(dāng)?shù)貢r(shí)間周日宣布,其對(duì)話式語音識(shí)別系統(tǒng)的出錯(cuò)率達(dá)到5.1%,創(chuàng)下目前為止的最低水平,超過了去年微軟人工智能及研究事業(yè)部一組研究人員所實(shí)現(xiàn)的5.9%出錯(cuò)率,達(dá)到了專業(yè)速錄員的同等水平。在此次研究中,專業(yè)速錄員具備重復(fù)收聽錄音等優(yōu)勢。
  這兩次研究轉(zhuǎn)錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對(duì)話,自上世紀(jì)90年代以來一直被研究人員作為測試語音識(shí)別系統(tǒng)的樣本。
  新研究由微軟人工智能及研究事業(yè)部的一組研究人員實(shí)施,目標(biāo)是在出錯(cuò)率上達(dá)到一組速錄員的同等水平,后者可以反復(fù)收聽錄音樣本,了解對(duì)話語境,與其他速錄員合作。
  整體來說,通過改進(jìn)微軟語音識(shí)別系統(tǒng)中基于神經(jīng)網(wǎng)絡(luò)的聽覺和語言模型,實(shí)施最新研究的研究人員能夠在去年基礎(chǔ)上把出錯(cuò)率降低大約12%。顯然,他們還可以讓語音識(shí)別器了解整體對(duì)話,適應(yīng)錄音樣本的語境,預(yù)測對(duì)話中很可能出現(xiàn)的下一個(gè)詞匯或短語。這正是人類在與其他人對(duì)話時(shí)的做法。
  微軟的語音識(shí)別系統(tǒng)已被用于語音助手“小娜”、實(shí)時(shí)翻譯字幕功能Presentation Translator以及微軟認(rèn)知服務(wù)中。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題