您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)際 >
 首頁(yè) > 新聞 > 國(guó)際 >

Google更新云端語(yǔ)音轉(zhuǎn)文字服務(wù)、聽(tīng)寫(xiě)電話出錯(cuò)率減少54%

2018-04-10 16:47:48   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  Cloud Speech-to-Text服務(wù)大改版,提供命令與搜尋、電話、影片與預(yù)設(shè)4種模式,其中強(qiáng)化後的電話模式聽(tīng)寫(xiě)電話的錯(cuò)誤率降低了54%,而與YouTube加上字幕技術(shù)雷同的影片模式轉(zhuǎn)錄錯(cuò)誤率也降低了64%。
  繼上個(gè)月發(fā)表云端文字轉(zhuǎn)語(yǔ)音(Cloud Text-to-Speech)服務(wù)之後,Google在周一(4/9)更新了云端語(yǔ)音轉(zhuǎn)文字(Cloud Speech-to-Text)服務(wù),提供全新的影片及電話轉(zhuǎn)錄模型,也新增了自動(dòng)化標(biāo)點(diǎn)符號(hào)功能。相較於原本的電話模型,新的強(qiáng)化版電話轉(zhuǎn)錄模型(enhanced phone_call model)讓語(yǔ)音辨識(shí)的錯(cuò)誤率減少了54%。
  Google於2016年發(fā)表的Cloud Speech-to-Text原名為Cloud Speech API,可辨識(shí)包括中文在內(nèi)的逾120種語(yǔ)言,本周則是該服務(wù)建立以來(lái)最大規(guī)模的改版,它提供了4種客制化模式,包括命令與搜尋(command_and_search)、電話(phone_call)、影片(video)與預(yù)設(shè)(default),其中,電話模型適用於基於8khz取樣率記錄的電話內(nèi)容,而預(yù)設(shè)模型則多用在音質(zhì)較好、時(shí)間較長(zhǎng)、取樣率高於16khz以上的音頻,使用者可依照不同的使用情境選擇適用的模型,以順利將語(yǔ)音轉(zhuǎn)換成文字。
  Google Cloud AI產(chǎn)品經(jīng)理Dan Aharon表示,有許多云端供應(yīng)商利用客戶的請(qǐng)求來(lái)改善相關(guān)服務(wù),但基於資料及隱私保護(hù)的立場(chǎng),Google并不打算采用這樣的作法,取而代之的是推出業(yè)界首創(chuàng)的「選擇加入計(jì)畫(huà)」( opt-in program),讓客戶主動(dòng)提供資料供Google紀(jì)錄與分析,而首個(gè)成品就是強(qiáng)化版電話轉(zhuǎn)錄模式,該計(jì)畫(huà)成功地讓Cloud Speech-to-Text的電話轉(zhuǎn)錄服務(wù)減少了54%的錯(cuò)誤。
  至於新的影片模式則可用來(lái)將影片中的語(yǔ)音轉(zhuǎn)換成文字,或是轉(zhuǎn)錄同時(shí)有多人開(kāi)講的語(yǔ)音,該模式所使用的機(jī)器學(xué)習(xí)技術(shù)與YouTube自動(dòng)化字幕背後的技術(shù)雷同,相較於原本的預(yù)設(shè)模式,影片模式的轉(zhuǎn)錄錯(cuò)誤率也降低了64%。
  不管是強(qiáng)化版的語(yǔ)音模式或影片模式現(xiàn)在都只支援英文,預(yù)計(jì)很快就會(huì)擴(kuò)張至其它語(yǔ)言。
  除了全新的語(yǔ)音及影片模式之外,新版的Cloud Speech-to-Text還準(zhǔn)備在將語(yǔ)音轉(zhuǎn)成文字之後,自動(dòng)加入標(biāo)點(diǎn)符號(hào),以讓文字更容易閱讀,目前該模式仍屬於測(cè)試階段,可提供逗點(diǎn)、句號(hào)或問(wèn)號(hào)等標(biāo)點(diǎn)符號(hào)的建議。
  除了影片模式每15秒的收費(fèi)為0.012美元之外,其它模式的費(fèi)用皆為每15秒0.006美元,為了推廣全新的影片模式,截至今年5月31日可享用每15秒0.006美元的優(yōu)惠價(jià)。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題