您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)際 >
 首頁(yè) > 新聞 > 國(guó)際 >

Google云端語(yǔ)音識(shí)別API上線(xiàn)!連中文也能轉(zhuǎn)為文字

2017-04-21 10:22:53   作者:   來(lái)源: ithome    評(píng)論:0  點(diǎn)擊:


  Google日前正式發(fā)布旗下云端語(yǔ)音識(shí)別API,支持80多種語(yǔ)言,也能辨識(shí)正體中文。而新版API加強(qiáng)了長(zhǎng)版音頻檔的轉(zhuǎn)錄精準(zhǔn)度,也新增支持WAV、Opus和Speex文件格式,且Google也宣稱(chēng),新版語(yǔ)音識(shí)別API比舊版的批處理速度快3倍。
Google云端語(yǔ)音識(shí)別API上線(xiàn)!連中文也能轉(zhuǎn)為文字
  日前,Google推出旗下云端語(yǔ)音識(shí)別API(Cloud Speech API)正式版(GA),Google云端語(yǔ)音識(shí)別服務(wù)能夠?qū)崟r(shí)辨識(shí)80種以上的語(yǔ)言,轉(zhuǎn)換成文字,連正體中文也可以辨識(shí)。
  Google在2016年夏天釋出云端語(yǔ)音識(shí)別API公開(kāi)測(cè)試版,現(xiàn)在終于推出正式版,提供云端開(kāi)發(fā)人員使用。
  而云端語(yǔ)音識(shí)別API采用與Google Now、Google搜尋及Google Assistant相同的語(yǔ)音識(shí)別技術(shù),根據(jù)Google,云端語(yǔ)音識(shí)別API是幾款預(yù)先訓(xùn)練機(jī)器學(xué)習(xí)模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來(lái)執(zhí)行如影像分析、圖像分析、文字分析和動(dòng)態(tài)翻譯等常見(jiàn)的任務(wù)。
  在正式版的云端語(yǔ)音識(shí)別API,Google加強(qiáng)了長(zhǎng)度較長(zhǎng)的音頻檔案轉(zhuǎn)錄精準(zhǔn)度,以及新增支持WAV、Opus和Speex文件格式。Google也聲稱(chēng),新版語(yǔ)音識(shí)別API比舊版的批處理速度快3倍。
  另外,目前已有廠(chǎng)商采用Google云端語(yǔ)音識(shí)別API,根據(jù)Google官網(wǎng),美國(guó)德州的電話(huà)語(yǔ)音SaaS開(kāi)發(fā)商InteractiveTel采用Google云端語(yǔ)音識(shí)別服務(wù),透過(guò)實(shí)時(shí)的語(yǔ)音轉(zhuǎn)文字,來(lái)分析業(yè)者與顧客在電話(huà)中的互動(dòng),以協(xié)助業(yè)者提升銷(xiāo)售業(yè)績(jī)。

專(zhuān)題