首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識(shí)別(ASR)  語音識(shí)別產(chǎn)品

新型計(jì)算機(jī)語音識(shí)別功能接近大腦

2004/12/24

  俄羅斯科學(xué)院無線電與電子技術(shù)研究所科研人員安齊佩羅夫開發(fā)出一種全新的計(jì)算機(jī)語音識(shí)別系統(tǒng)。通過實(shí)驗(yàn)發(fā)現(xiàn),語音頻譜中最基本的成分接近1千赫。

  安齊佩羅夫指出,理論上最智能的語音識(shí)別系統(tǒng)應(yīng)該像人的大腦一樣,能在瞬間從大量聲音中分辨出已知的聲音,而不依賴聲音的大小和聲調(diào)。目前的計(jì)算機(jī)識(shí)別系統(tǒng)還沒有達(dá)到這種水平。每種聲音對(duì)機(jī)器識(shí)別系統(tǒng)來說,仍是獨(dú)一無二的,因此需要在機(jī)器上進(jìn)行訓(xùn)練。由于長期訓(xùn)練的結(jié)果,在計(jì)算機(jī)的存儲(chǔ)系統(tǒng)中形成了一個(gè)信息庫,將某種聲音的大量方案存儲(chǔ)到這里,當(dāng)計(jì)算機(jī)遇到某種聲音時(shí),就在這個(gè)信息庫里進(jìn)行挑選加工,然后選出某種可能的方案。

  安齊佩羅夫在解釋自己開發(fā)的語音識(shí)別系統(tǒng)時(shí)指出,這一獨(dú)特的語音識(shí)別系統(tǒng)最主要的是考慮了語音的分級(jí)體系,從中辨別語音中最基本的成分,就像鑒別音樂中的音調(diào)一樣,在寬廣的語音頻譜中,分辨出語音中最基本的具有思維性質(zhì)的聲音頻譜。實(shí)驗(yàn)表明,這個(gè)頻譜的范圍接近1千赫,而其他那些帶有情感色彩的語調(diào),屬于心理物理學(xué)范疇。

  安齊佩羅夫進(jìn)一步介紹說,在上述理論指導(dǎo)下,他開發(fā)的計(jì)算機(jī)語音識(shí)別系統(tǒng)接近大腦的識(shí)別功能:計(jì)算機(jī)在系統(tǒng)程序的指導(dǎo)下,將語音背景的個(gè)性成分清除,保留語音中最基本的成分,最大可能地簡化了計(jì)算機(jī)的工作。在實(shí)驗(yàn)中,科研人員讓十幾人用不同聲音進(jìn)行實(shí)驗(yàn),結(jié)果發(fā)現(xiàn),計(jì)算機(jī)能夠避開那些帶有情感色彩的語調(diào)的干擾,準(zhǔn)確地通過語音中最基本的成分辨別聲音,1000比特的內(nèi)存就能識(shí)別所有的數(shù)字和一些簡單的語音

  有關(guān)專家指出,該識(shí)別體系不僅達(dá)到了快速辨別語音的能力,還使計(jì)算機(jī)的存儲(chǔ)時(shí)間和內(nèi)存降低。該科研成果最適合大量的移動(dòng)電子裝置領(lǐng)域。

科技日?qǐng)?bào)



相關(guān)鏈接:
得意公司成功舉辦技術(shù)培訓(xùn)并發(fā)布軟件新版本 2004-12-24
中科信利在電信級(jí)語音識(shí)別產(chǎn)業(yè)化方面取得突破性進(jìn)展 2004-12-16
科勝通EnsemblePro與言豐文語轉(zhuǎn)換引擎集成測(cè)試獲得成功 2004-12-15
短信和菜單用語音表示盲人使用手機(jī)不再有困難 2004-12-14
北京捷通華聲成為Eicon技術(shù)合作伙伴(ETP) 2004-12-13

分類信息:  國外動(dòng)態(tài)_與_語音合成TTS  國外動(dòng)態(tài)_與_語音識(shí)別ASR  語音合成TTS_與_語音識(shí)別ASR