首頁(yè)>>>技術(shù)>>>語(yǔ)音應(yīng)用>>>語(yǔ)音識(shí)別(ASR)  語(yǔ)音識(shí)別產(chǎn)品

英國(guó)科學(xué)家成功開發(fā)識(shí)別多種語(yǔ)言唇讀技術(shù)
對(duì)耳聾患者、執(zhí)法機(jī)構(gòu)以及嘈雜環(huán)境中的工作者具有實(shí)際應(yīng)用意義

2009/09/07


  計(jì)算機(jī)能夠進(jìn)行唇讀這并不新鮮,但是在英國(guó),它們首次被“教會(huì)”識(shí)別不同的語(yǔ)言。

  英國(guó)科學(xué)家日前研制出可以分辨不同語(yǔ)言的唇讀計(jì)算機(jī)。其實(shí)研究人員一直在開發(fā)可以讀唇語(yǔ)的計(jì)算機(jī),但是它們被“教會(huì)”識(shí)別各種語(yǔ)言還是第一次?茖W(xué)家指出,這項(xiàng)發(fā)明對(duì)耳聾患者、執(zhí)法機(jī)構(gòu)以及嘈雜環(huán)境中的工作者具有實(shí)際應(yīng)用意義。

  這項(xiàng)研究由英國(guó)東安格利亞大學(xué)計(jì)算機(jī)科學(xué)學(xué)院的Stephen Cox和Jake Newman指導(dǎo)完成。該技術(shù)是通過對(duì)23位掌握兩種或三種語(yǔ)言的人的唇部動(dòng)作進(jìn)行統(tǒng)計(jì)建模而開發(fā)的。該系統(tǒng)能夠識(shí)別單個(gè)講話者所說(shuō)的語(yǔ)言,而且具有很高的準(zhǔn)確性。這些語(yǔ)言包括英語(yǔ)、法語(yǔ)、德語(yǔ)、阿拉伯語(yǔ)、漢語(yǔ)普通話及粵語(yǔ)、意大利語(yǔ)、波蘭語(yǔ)和俄語(yǔ)。

  Cox表示:“這是自動(dòng)唇讀技術(shù)的一次令人激動(dòng)的進(jìn)步,它第一次科學(xué)地證實(shí)了我們已有的直觀推斷,即當(dāng)人們講不同的語(yǔ)言時(shí),他們會(huì)以不同的順序出現(xiàn)不同的唇形!盋ox介紹說(shuō),“例如,我們發(fā)現(xiàn)講法語(yǔ)的人較常出現(xiàn)圓唇形,而講阿拉伯語(yǔ)的人具有很明顯的舌部動(dòng)作。”

  Cox補(bǔ)充說(shuō):“多年來(lái),科學(xué)家一直在進(jìn)行語(yǔ)音和語(yǔ)言處理法則的基礎(chǔ)研究,比如噪音中的語(yǔ)音識(shí)別、公式化語(yǔ)言建模、由語(yǔ)音合成所做的語(yǔ)言處理以及語(yǔ)音處理應(yīng)用的開發(fā)!

  據(jù)研究人員介紹,自動(dòng)唇讀技術(shù)中蘊(yùn)含著許多科學(xué)挑戰(zhàn)。目前的項(xiàng)目已經(jīng)解決了其中的幾個(gè)主要科學(xué)問題,包括面部動(dòng)作與感知語(yǔ)音之間是什么關(guān)系;講話者的語(yǔ)言以及談話內(nèi)容如何影響這種關(guān)系;語(yǔ)言、講話者的姿勢(shì)以及談話內(nèi)容對(duì)識(shí)別準(zhǔn)確度有什么影響等。

  這項(xiàng)研究屬于一個(gè)更寬泛的自動(dòng)唇讀項(xiàng)目中的一部分。該項(xiàng)目將建立在先進(jìn)的計(jì)算機(jī)視頻和語(yǔ)音識(shí)別技術(shù)之上,對(duì)視頻中的自動(dòng)唇讀進(jìn)行研究和評(píng)估,從而開發(fā)能夠?qū)?lái)自視頻中的目標(biāo)進(jìn)行自動(dòng)、語(yǔ)言獨(dú)立唇讀的工具和技術(shù)。該項(xiàng)目還尋求量化人類以及自動(dòng)機(jī)器的能力。研究人員下一步將使這個(gè)系統(tǒng)更加適合個(gè)人生理學(xué),以及人們說(shuō)話的方式。

《科學(xué)時(shí)報(bào)》



相關(guān)鏈接:
科大訊飛嵌入式語(yǔ)音新產(chǎn)品發(fā)布會(huì)在深圳舉行 2009-09-07
Convergys定制式語(yǔ)音鑒權(quán)方案獲市場(chǎng)領(lǐng)袖獎(jiǎng) 2009-09-02
傳蘋果正研發(fā)iPhone語(yǔ)音識(shí)別技術(shù) 可撰寫郵件 2009-08-31
開源的語(yǔ)音識(shí)別軟件Simon 0.2發(fā)布 2009-08-28
訊飛語(yǔ)音助力太平人壽客服中心 2009-08-28