首頁>>廠商>>系統(tǒng)集成及應(yīng)用軟件開發(fā)商>>廣州新太科技公司

國內(nèi)IVR應(yīng)用語音識別還不多

彭凌哲 2000/12/07

  目前的語音識別系統(tǒng)分為兩種:一種是面向計算機(jī)個人用戶的,一般安裝在用戶的個人計算機(jī)上;另一種是面向CTI領(lǐng)域的,主要是使CTI應(yīng)用系統(tǒng)能夠?qū)崿F(xiàn)語音識別功能。


  ■CTI對語音識別提高要求


  應(yīng)用于CTI領(lǐng)域的語音識別技術(shù)有別于一般PC機(jī)系統(tǒng)所使用的語音識別技術(shù),其面臨的困難體現(xiàn)為:電話錄音質(zhì)量差,識別率要求高,系統(tǒng)不能對電話用戶進(jìn)行訓(xùn)練;另外,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應(yīng)用于CTI領(lǐng)域的語音識別技術(shù)在功能和性能上要有更高要求。

  由于存在上面列舉的種種困難,使得應(yīng)用于CTI領(lǐng)域的ASR技術(shù)不可能像應(yīng)用于PC機(jī)的ASR技術(shù)一樣,能夠隨心所欲地識別用戶所說的任何詞匯。因此,目前應(yīng)用于CTI領(lǐng)域的ASR技術(shù)是一種基于詞匯和語法的識別技術(shù)。對于一個CTI應(yīng)用系統(tǒng),需要根據(jù)系統(tǒng)需求設(shè)計一種語法,語法必須包括與用戶交互時用戶所有可能的語音輸入,而詞匯就來自于語法中所有可能出現(xiàn)的單詞。不同的ASR廠商還會加入一些增強(qiáng)性的功能,如barge-in打斷功能、自然語言理解等等。


  ■語音識別拓展CTI應(yīng)用


  ASR技術(shù)給CTI領(lǐng)域帶來了更加廣闊的前景。以往用戶使用電話接入時,與系統(tǒng)進(jìn)行交互就只能通過電話按鍵或人工服務(wù)進(jìn)行交互,對于復(fù)雜的系統(tǒng),如郵政編碼查詢、天氣預(yù)報、航班查詢等,如果使用按鍵表示的話,用戶根本無法記住這些表示,而只能通過人工服務(wù)進(jìn)行查詢。像傳統(tǒng)的168信息服務(wù),由于只能使用按鍵進(jìn)行服務(wù),用戶又無法記住如此之多的號碼及功能選項數(shù)字,大大降低了使用168信息服務(wù)的用戶。而使用人工服務(wù),又增加了系統(tǒng)運營商的運營成本。

  ASR技術(shù)的出現(xiàn)必將改變這一情況。通過語音識別技術(shù),CTI系統(tǒng)可以實現(xiàn)讓用戶使用語音與系統(tǒng)進(jìn)行自動交互,如用戶要查詢城市天氣情況,只需說出城市名稱;要查詢航班情況,只需說出目的地城市;要查詢股票價格,只需說出該股票的名稱。再結(jié)合TTS(Text To Speech文本轉(zhuǎn)語音)技術(shù),CTI系統(tǒng)可以提供非常強(qiáng)大的電話自動交互系統(tǒng)。

  目前ASR技術(shù)與CTI的結(jié)合在國外已有大量實際應(yīng)用的實例,國外許多大公司,其電話總機(jī)系統(tǒng)大都采用了ASR技術(shù)。外線接入時,無需撥打分機(jī)號碼,只需要說出要找的人的姓名或辦公室名稱即可。更大規(guī)模的應(yīng)用如企業(yè)黃頁查詢、客戶服務(wù)中心,ASR技術(shù)已得到越來越多實踐。


  ■IVR用語音識別還不多


  目前主要的ASR廠商,國外的主要有飛利浦、Nuance、IBM等,國內(nèi)的有香港特區(qū)的InfoTalk等。各個廠商都提供了多個層次的開發(fā)包及相關(guān)開發(fā)工具,實現(xiàn)的功能及效果也大致相近,但在細(xì)節(jié)上也存在許多差異。相比之下,Nuance公司的產(chǎn)品顯得功能更齊全,性能更優(yōu);而InfoTalk的產(chǎn)品則中文本土化的程度更高,在中文識別上絲毫不遜色。

  新太科技一直密切關(guān)注ASR技術(shù)的發(fā)展,早在1999年10月,新太科技就與飛利浦公司在語音識別技術(shù)上簽定了合作協(xié)議。在今年又先后與Nuance和InfoTalk公司達(dá)成了合作意向。新太科技使用當(dāng)今世界最先進(jìn)的ASR/TTS技術(shù),已開發(fā)出了一系列全新的應(yīng)用系統(tǒng),并將在未來結(jié)合語音互聯(lián)網(wǎng)進(jìn)行全面的應(yīng)用推廣。

《賽迪市場專家》 2000/12/07


分類信息:  交互語音_與_語音識別ASR     技術(shù)_交互語音_文摘   技術(shù)_語音識別_文摘