首頁>>廠商>>交換機(jī)/ACD系統(tǒng)平臺廠商>>IBM>>語音產(chǎn)品ViaVoice

ViaVoice:半個(gè)世紀(jì)的求索

2001/10/10

您也許曾經(jīng)為科幻電影中出現(xiàn)的下列場景所吸引:機(jī)器人能聽懂和服從主人的命令,為其所用。雖然到今天,這樣的機(jī)器人還沒能成為現(xiàn)實(shí),但是作為機(jī)器人的“耳朵”,語音識別技術(shù)卻在近幾年有了許多突破性的進(jìn)展,從實(shí)驗(yàn)室走進(jìn)了我們的生活。目前被廣泛使用的IBM ViaVoice軟件便是其中最典型的代表。

從50年代初期開始,IBM公司就在尋求一種更加有效的與計(jì)算機(jī)系統(tǒng)交互的方式。幾年后,以此為目標(biāo)的語音識別研究在IBM華生(Watson)研究中心進(jìn)行。研究之初,IBM的科學(xué)家們需要一套十分龐大的機(jī)器,研究中心所有的高級計(jì)算機(jī)資源到了晚上全部被語音識別的訓(xùn)練和計(jì)算所占用。面對比最初想象得多的巨大挑戰(zhàn),科學(xué)家們不得不把目標(biāo)降低:只要計(jì)算機(jī)能聽懂有限的詞匯,或者只能聽懂某個(gè)人說話即可,不需要聽懂每一個(gè)人的話。但他們從來都沒有放棄。經(jīng)過不懈的努力,終于實(shí)現(xiàn)了一個(gè)個(gè)突破。

這些重要的突破中,將“隱馬爾科夫模型”引入語音識別領(lǐng)域,為語音模型的建立提供了基礎(chǔ);“n元統(tǒng)計(jì)語音模型”讓計(jì)算機(jī)學(xué)會了“學(xué)習(xí)”和“記憶”人們怎樣用詞;“快速匹配方法”的發(fā)明則顯著提高了大詞匯系統(tǒng)識別的速度。它們和其他不勝枚舉的發(fā)明一起,使語音識別技術(shù)走進(jìn)我們的生活。IBM公司的許多科學(xué)家在這個(gè)領(lǐng)域長期不懈的努力和獲得的100多項(xiàng)專利,確定了公司技術(shù)上的領(lǐng)先地位。世界上許多研究機(jī)構(gòu)和公司的其他科學(xué)家,也為這一領(lǐng)域的發(fā)展做出了卓越的貢獻(xiàn)。

1997年IBM ViaVoice 4.0的誕生對于語音識別史意義重大。漢語具有同音字多、有聲調(diào)、口音復(fù)雜等特點(diǎn),因此中文的語音識別技術(shù)被認(rèn)為是“王冠上的明珠”。在跨越了連續(xù)語音、大量詞匯,以及非特定識別人等難關(guān)之后,IBM公司成功地推出了世界上第一個(gè)中文連續(xù)語音識別產(chǎn)品——IBM ViaVoice 4.0,它被認(rèn)為是中文識別領(lǐng)域重要的里程碑。

經(jīng)過半個(gè)世紀(jì)的求索,如今IBM不僅已經(jīng)使機(jī)器聽懂人話成為現(xiàn)實(shí),而且ViaVoice還具有語音查詢、語音上網(wǎng)、網(wǎng)上聊天等許多功能,使用起來更方便、識別的更準(zhǔn)確。它讓人類的夢想實(shí)現(xiàn)得如此完美!

IBM供稿 CTI論壇編輯



相關(guān)鏈接:
ViaVoice語音上網(wǎng)新概念 2001-11-14
IBM ViaVoice更方便更健康 2001-11-14
語音識別重在應(yīng)用 2001-11-14
IBM ViaVoice Telephony——完善的中文電話語音技術(shù) 2001-11-14
CRM中的IBM語音技術(shù) 2001-10-10