您當(dāng)前的位置是:  首頁 > 新聞 > 國際 >
 首頁 > 新聞 > 國際 >

Google更新云端語音API 錄音檔也能直接搜尋關(guān)鍵字!

2017-08-21 14:44:20   作者:   來源:CTI論壇   評論:0  點擊:


Google更新云端語音API 錄音檔也能直接搜尋關(guān)鍵字!
  Google更新云端語音API(Google Cloud Speech API),除了新增時間標記功能,可識別的語音檔案長度也從80分鐘增加到3小時,并一口氣新增30種可識別語言,讓第三方開發(fā)商能在更多類型的服務(wù)中應(yīng)用Google的語音識別技術(shù)。
  可在錄音檔中搜尋關(guān)鍵字、直接跳到關(guān)鍵字出現(xiàn)的段落
  「語音」很可能是繼打字之后,未來人類和電腦溝通的主要方式,其不僅解放我們的雙手,互動速度也更快。Google在去年發(fā)布這款能將語音轉(zhuǎn)成文字的云端語音API,并將該功能整合進多款自家服務(wù)中,如語音助理、語音搜尋、翻譯、聽寫輸入等功能。
  而這次更新的其中一個新功能,對常聽錄音檔的人相當(dāng)必備。過去只有文字檔才能搜尋特定字詞,現(xiàn)在,在Google云端語音API新增「以字為單位的時間標記」的功能后,語音檔也能做到相同的事,即可在語音檔中搜尋特定字詞出現(xiàn)的位置、直接跳到該段落,且錄音檔播放的同時也能立即顯示已識別的文字。
  支援檔案長度增加到3小時,可用于客服中心和自動產(chǎn)生影片字幕
  此外,Google云端語音API可支援的語音檔案長度,也從原本的80分鐘增加到3小時。Google產(chǎn)品經(jīng)理DanAharon表示,支援更長時間的語音檔案,也能拓展該技術(shù)能應(yīng)用的場景,例如客服中心可用此分析客服電話內(nèi)容,或是用于自動生成影片字幕。
  語音轉(zhuǎn)文字支援「表情符號」
  在支援語言方面,這次Google更一口氣新增30個語言,迄今共支援119種語言。Google表示,他們和母語人士合作,請他們念常用的句子,訓(xùn)練機器學(xué)習(xí)模型識別新語言的單字和音調(diào)。
  特別的是,Google云端語音API不只能識別說話的「內(nèi)容」,還能識別出「表情符號」。例如,只要念出「眨眼表情符號」或「微笑表情符號」,就會出現(xiàn)和。不過,該功能目前僅支援英語,其他語言將在未來陸續(xù)開放。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題