首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>基立訊

jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)完成超大容量詞匯識(shí)別率測(cè)試

2010/05/14

背景

  長(zhǎng)期以來(lái),關(guān)于語(yǔ)音識(shí)別準(zhǔn)確率這一硬性技術(shù)指標(biāo),業(yè)界給客戶(hù)的感覺(jué)總是支支吾吾,模棱兩可。很多語(yǔ)音技術(shù)供應(yīng)商在這項(xiàng)指標(biāo)上要么標(biāo)榜達(dá)到96%甚至98%的識(shí)別準(zhǔn)確率,但實(shí)際部署的系統(tǒng)遠(yuǎn)遠(yuǎn)達(dá)不到這個(gè)指標(biāo)或者這個(gè)指標(biāo)只是針對(duì)碼本非常小的系統(tǒng)(數(shù)百個(gè)碼本容量)而言。這種狀況很容易造成用戶(hù)對(duì)目前語(yǔ)音識(shí)別技術(shù)的誤解。特別是,現(xiàn)實(shí)情況中,有很多的語(yǔ)音技術(shù)供應(yīng)商由于本身技術(shù)的不過(guò)硬,造成實(shí)際部署的系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確率較低,難以令用戶(hù)滿(mǎn)意,間接對(duì)該技術(shù)的推廣造成了負(fù)面影響。

  正是針對(duì)這種情況,也本著對(duì)客戶(hù)負(fù)責(zé)的理念,上海基立訊信息科技有限公司精心組織實(shí)施了對(duì)這一指標(biāo)的實(shí)際測(cè)試。為了體現(xiàn)測(cè)試結(jié)果的可信性、實(shí)用性,基立訊對(duì)碼本容量、測(cè)試數(shù)據(jù)、測(cè)試人樣本等等因素進(jìn)行了綜合考慮。實(shí)際測(cè)試系統(tǒng)在碼本容量的設(shè)置上全部超過(guò)6000條記錄;在測(cè)試數(shù)據(jù)的選擇上采用從互聯(lián)網(wǎng)隨機(jī)下載真實(shí)姓名以反映真實(shí)的用戶(hù)數(shù)據(jù);在測(cè)試人樣本上盡量考慮不同地域、不同性別和不同年齡的測(cè)試人,測(cè)試人樣本覆蓋全國(guó)絕大部分省市口音的男、女人員,同時(shí)測(cè)試人年齡限制在18-55歲的群體以反映語(yǔ)音識(shí)別技術(shù)最廣泛的目標(biāo)用戶(hù)群。

  值得一提的是,測(cè)試數(shù)據(jù)中有非常多的姓名要么極其相近、要么發(fā)音即使真人都很難區(qū)分,是非常具有挑戰(zhàn)性的測(cè)試數(shù)據(jù)。但即使這樣,jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)系統(tǒng)在采用先進(jìn)的語(yǔ)音采集和處理方法和獨(dú)特的N-Best結(jié)果分析處理算法后,不但有效提高了系統(tǒng)總體使用的語(yǔ)音識(shí)別準(zhǔn)確率,同時(shí)也增加了系統(tǒng)不用多選直接得到識(shí)別結(jié)果的概率,也降低了碼本外詞匯的誤識(shí)別率,使jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)系統(tǒng)用戶(hù)使用總體感受非常準(zhǔn)確又很方便。

測(cè)試結(jié)果

  經(jīng)過(guò)上百例的實(shí)際測(cè)試,基立訊jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)系統(tǒng)得到的一次語(yǔ)音識(shí)別準(zhǔn)確率平均在93%左右,二次語(yǔ)音識(shí)別準(zhǔn)確率平均超過(guò)97%。也就是說(shuō),對(duì)于碼本在1萬(wàn)個(gè)的情況下,用戶(hù)在說(shuō)了一次姓名后,系統(tǒng)返回的結(jié)果中包含正確結(jié)果的概率約為93%,但如果用戶(hù)是說(shuō)了2遍,那么用戶(hù)有97%以上的可能性會(huì)得到系統(tǒng)正確的識(shí)別結(jié)果響應(yīng)。其實(shí),根據(jù)測(cè)試,對(duì)很多白領(lǐng)而言,只有1%稍多一點(diǎn)的姓名是用戶(hù)在2次呼叫后都無(wú)法得到正確返回結(jié)果的,也就是說(shuō),對(duì)絕大多數(shù)的潛在白領(lǐng)語(yǔ)音識(shí)別用戶(hù),2次呼叫之內(nèi)達(dá)到98%以上的識(shí)別結(jié)果準(zhǔn)確率是完全現(xiàn)實(shí)的?紤]到測(cè)試人樣本中不乏有濃重口音的人,這樣的數(shù)據(jù)非常令人鼓舞。此外,這次測(cè)試也對(duì)系統(tǒng)一次識(shí)別不用N-Best選擇就返回正確結(jié)果的概率等其他參數(shù)進(jìn)行了統(tǒng)計(jì),得到了非常寶貴的權(quán)威數(shù)據(jù)。需要指出的是,如果運(yùn)用jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)平臺(tái)已經(jīng)集成的組合呼叫識(shí)別功能(例如,部門(mén)名+姓名,部門(mén)名+昵稱(chēng)名等等),那么在2次呼叫內(nèi)系統(tǒng)有接近100%的概率返回用戶(hù)所呼叫的信息,這樣的測(cè)試結(jié)果完全說(shuō)明基立訊語(yǔ)音識(shí)別產(chǎn)品在技術(shù)和應(yīng)用上都處于國(guó)內(nèi)領(lǐng)先,完全可以達(dá)到大規(guī)模商業(yè)應(yīng)用的要求。

  基立訊jTalk語(yǔ)音總機(jī)和語(yǔ)音撥號(hào)系統(tǒng)除了具有業(yè)界最高的識(shí)別準(zhǔn)確率外,還無(wú)縫集成了電話防火墻、來(lái)電轉(zhuǎn)接、留言信箱、號(hào)碼綁定、事件提醒、114按鍵樹(shù)型自動(dòng)查號(hào)臺(tái)、號(hào)碼本管理、語(yǔ)音提示上載、節(jié)假日語(yǔ)音流程設(shè)置等等眾多實(shí)用功能,是企業(yè)電話通信的一站式解決方案。

  通過(guò)這次權(quán)威的實(shí)際測(cè)試,基立訊得到了語(yǔ)音識(shí)別系統(tǒng)真實(shí)的識(shí)別率數(shù)據(jù),是目前國(guó)內(nèi)業(yè)界見(jiàn)到的公開(kāi)的最權(quán)威也是最高的實(shí)際部署系統(tǒng)的識(shí)別準(zhǔn)確率。

CTI論壇編輯



相關(guān)閱讀:
基立訊Jcc呼叫中心方案集成語(yǔ)音識(shí)別和語(yǔ)音合成 2010-04-09
基立訊jTalk語(yǔ)音通信平臺(tái) 2010-04-02
上;⒂嵧瞥龊艚兄行钠脚_(tái)軟件jcc V1.0 2010-03-31
基立訊Jcc呼叫中心軟件應(yīng)用于遼寧交通“96155” 2010-03-30
基立訊jTalk語(yǔ)音識(shí)別總機(jī)和撥號(hào)系統(tǒng)應(yīng)用浦發(fā)銀行 2010-03-29

分類(lèi)信息:  企業(yè)通信_(tái)與_語(yǔ)音應(yīng)用  企業(yè)通信_(tái)與_企業(yè)  企業(yè)通信_(tái)與_企業(yè)