您當(dāng)前的位置是:  首頁 > 新聞 > 國際 >
 首頁 > 新聞 > 國際 >

Mozilla啟動(dòng)首個(gè)開源語音辨識(shí)引擎專案Common Voice

2017-07-21 14:43:46   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  相較於Google、Amazon等主導(dǎo)的語音辨識(shí)技術(shù),Mozilla啟動(dòng)開源語音辨識(shí)引擎專案Common Voice,希望透過公開募集語音錄音檔,提高語音辨識(shí)的準(zhǔn)確性,未來匯集足夠資料量后將Common Voice資料庫釋出供外界使用。
  因應(yīng)語音辨識(shí)蔚為風(fēng)潮,Mozilla宣布啟動(dòng)第一個(gè)旨在訓(xùn)練語音辨識(shí)app的開源資料集的群眾募資計(jì)畫Common Voice。
  這項(xiàng)專案在6月間釋出,目前已開始訓(xùn)練階段。Mozilla指出,現(xiàn)今許多軟件大廠,包括Google、蘋果及亞馬遜都各自推出了語音辨識(shí)服務(wù),喊了個(gè)指令就可以開始作業(yè),似乎很方便,但是這種大廠控制的語音辨識(shí)生態(tài)圈卻可能扼殺了創(chuàng)新者的進(jìn)入。
  一來,大廠只會(huì)著重特定英文、中文、西文等等主流語言,而忽略了使用者較少的其他語言。二者,這些生態(tài)圈產(chǎn)生的資料集也為大廠控制,使得也有意開發(fā)語音控制裝置的學(xué)生、新創(chuàng)公司及研究人員能存取的資料相當(dāng)有限。
  Common Voice專案現(xiàn)在開始到秋天,邀請(qǐng)開發(fā)人員大聲誦讀句子以協(xié)助語音辨識(shí)引擎的訓(xùn)練,貢獻(xiàn)量沒有上限,該計(jì)劃預(yù)計(jì)匯集1萬小時(shí)的語音錄音檔,也可協(xié)助聽取驗(yàn)證錄音檔的準(zhǔn)確性。
  Mozilla表示,資料量足夠后,預(yù)計(jì)2017年下半可以將Common Voice資料庫開源釋出,用以支援語音辨識(shí)裝置、app及作業(yè)系統(tǒng)的開發(fā)。

專題