您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)內(nèi) >
 首頁(yè) > 新聞 > 國(guó)內(nèi) >

科大訊飛語(yǔ)音識(shí)別率再提升 啟動(dòng)方言發(fā)言人招募活動(dòng)

2018-06-20 10:52:34   作者:   來源:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   評(píng)論:0  點(diǎn)擊:


  6月12日,科大訊飛在京舉辦了主題為“愛輸入 更懂你”的媒體見面會(huì),會(huì)上訊飛輸入法市場(chǎng)品牌負(fù)責(zé)人李強(qiáng)軍介紹,目前訊飛輸入法用戶規(guī)模突破6億,語(yǔ)音輸入月覆蓋率達(dá)50%。同時(shí),訊飛語(yǔ)音識(shí)別率也從97%提升至98%,訊飛輸入法支持?jǐn)U至23種方言,為更好利用AI來保護(hù)方言,訊飛將啟動(dòng)方言發(fā)音人招募活動(dòng)。
科大訊飛語(yǔ)音識(shí)別率再提升 啟動(dòng)方言發(fā)言人招募活動(dòng)
 
(圖片來源互聯(lián)網(wǎng))
  “輸入法從97%到98%準(zhǔn)確率的識(shí)別效果,提升的只是一個(gè)點(diǎn),這背后發(fā)生了什么?”訊飛輸入法之父翟吉博表示,識(shí)別準(zhǔn)確率的提升有三個(gè)難點(diǎn),一是使用場(chǎng)景多樣化,二是用戶習(xí)慣,三是中國(guó)漢字和文化的特殊性。針對(duì)這些難點(diǎn),訊飛做了很多的努力,比如針對(duì)多樣化的場(chǎng)景,科大訊飛分別推出了長(zhǎng)文本輸入、耳語(yǔ)輸入。針對(duì)用戶習(xí)慣和個(gè)性化,推出了個(gè)性化的訓(xùn)練模型,中英文混合輸入,針對(duì)23種方言也推出了懂你懂鄉(xiāng)音等。
  翟吉博表示,語(yǔ)音輸入更精準(zhǔn)的方法離不開數(shù)據(jù)和算法。訊飛輸入法從人腦神經(jīng)科學(xué)入手對(duì)人類記憶進(jìn)行仿生,實(shí)現(xiàn)大量無監(jiān)督的數(shù)據(jù)去輔助有人工標(biāo)注的數(shù)據(jù)。受圖像領(lǐng)域CNN應(yīng)用的啟發(fā),科大訊飛獨(dú)家研發(fā)了深度全序列卷積神經(jīng)網(wǎng)絡(luò)(Deep Fully Convolutional Neural Network,DFCNN)語(yǔ)音識(shí)別框架,使用大量的卷積層直接將語(yǔ)譜圖作為輸入,相比傳統(tǒng)語(yǔ)音特征作為輸入,有效降低信息損失,非常出色地表達(dá)語(yǔ)音的長(zhǎng)時(shí)相關(guān)性。同時(shí),借鑒了圖像識(shí)別中效果最好的網(wǎng)絡(luò)配置,每個(gè)卷積層使用3×3的小卷積核訓(xùn)練更深的CNN模型,輸出單元直接與最終的識(shí)別結(jié)果(比如音節(jié)或漢字),從而使識(shí)別準(zhǔn)確率顯著提升。
  本次見面會(huì)的另一個(gè)重要環(huán)節(jié)是啟動(dòng)“方言發(fā)音人招募”公益行動(dòng)。經(jīng)濟(jì)、文化活動(dòng)的全球化以及區(qū)域經(jīng)濟(jì)的迅速發(fā)展,導(dǎo)致主流語(yǔ)言或通用語(yǔ)言更加強(qiáng)勢(shì),同時(shí)也使得弱勢(shì)語(yǔ)言的交際功能不斷衰弱,甚至瀕臨消亡。目前世界上的語(yǔ)言有6000~10000種,據(jù)語(yǔ)言學(xué)家預(yù)測(cè),大部分語(yǔ)言將于本世紀(jì)末消失。因此,瀕危語(yǔ)言保護(hù)(以下簡(jiǎn)稱為“語(yǔ)保”)已經(jīng)成為了一項(xiàng)極重要而迫切的工作。
  科大訊飛多語(yǔ)種高級(jí)研究員祖漪清在現(xiàn)場(chǎng)講述了方言勢(shì)微的現(xiàn)狀,她強(qiáng)調(diào),利用人工智能技術(shù)進(jìn)行瀕危語(yǔ)言、方言系統(tǒng)研究,是實(shí)現(xiàn)對(duì)一個(gè)語(yǔ)言的完整“復(fù)制”的重要方式。因此,本次媒體見面會(huì)上,科大訊飛正式啟動(dòng)了“AI方言發(fā)音人招募”公益行動(dòng)。
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題