首頁(yè)>>廠商>>語(yǔ)音板卡開發(fā)商>> Dialogic

語(yǔ)音門戶的革命

英特爾公司Dialogic分部語(yǔ)音部技術(shù)營(yíng)銷經(jīng)理GeneEagle先生

電子商務(wù)是當(dāng)今世界最熱門的商業(yè)趨勢(shì),而語(yǔ)音門戶正在迅速成為電子商務(wù)中的熱點(diǎn);谡Z(yǔ)音的互聯(lián)網(wǎng)門戶,也就是語(yǔ)音門戶,代表著計(jì)算機(jī)語(yǔ)音與互聯(lián)網(wǎng)融合的新趨勢(shì)。

語(yǔ)音門戶讓用戶可隨時(shí)隨地輕松獲取各種信息。例如,用戶只需撥打語(yǔ)音門戶網(wǎng)的800號(hào)碼,就可在引導(dǎo)之下便捷瀏覽所需信息。在這個(gè)過程中,無(wú)須鍵入菜單選擇,僅需簡(jiǎn)單的語(yǔ)音應(yīng)答即可完成操作。所以,語(yǔ)音門戶簡(jiǎn)單易用--無(wú)論是通過PC機(jī)、手機(jī)、還是固定電話,也無(wú)論是在辦公室、家中、還是在路上、車上,“瀏覽”網(wǎng)絡(luò)的過程變得輕松無(wú)比!

由于語(yǔ)音技術(shù)的發(fā)展,語(yǔ)音門戶將電話交互過程從以廠商為中心轉(zhuǎn)向以用戶為中心。這一轉(zhuǎn)變?cè)跒橛脩籼岣咝屎徒档蜆I(yè)務(wù)成本的同時(shí),還將提高用戶的滿意度。

未來(lái)數(shù)年,語(yǔ)音門戶將大大改變?nèi)藗兪褂秒娫挼姆绞揭约皬S商與主叫用戶溝通的方式。在當(dāng)今以廠商為中心的模式中,主叫用戶只能以掛斷電話的方式來(lái)“擺脫”某一企業(yè)的交互式語(yǔ)音應(yīng)答(IVR)系統(tǒng)。而在未來(lái)以用戶為中心的模式中,主叫用戶可與語(yǔ)音門戶展開交互式對(duì)話,可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。

語(yǔ)音技術(shù)炙手可熱

語(yǔ)音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的“推進(jìn)器”之一。語(yǔ)音技術(shù)市場(chǎng)正在迅速成長(zhǎng),且發(fā)展勢(shì)頭良好。分析家預(yù)測(cè),從1999年到2004年,語(yǔ)音技術(shù)市場(chǎng)將以每年31%的速度持續(xù)增長(zhǎng)。語(yǔ)音技術(shù)市場(chǎng)的迅速擴(kuò)展意味著我們正面臨大量部署語(yǔ)音應(yīng)用的轉(zhuǎn)折期。

語(yǔ)音技術(shù)如此“火爆”有幾方面的原因,這既與語(yǔ)音技術(shù)本身有關(guān),同時(shí)也因?yàn)檎Z(yǔ)音技術(shù)能夠讓開發(fā)商不斷創(chuàng)建出真正滿足現(xiàn)實(shí)用戶需求的應(yīng)用。比如,90年代早期,簡(jiǎn)單的語(yǔ)音應(yīng)用只支持詞匯較少的(20到30個(gè)單詞)命令和控制指令,且只能識(shí)別不連續(xù)的數(shù)字,F(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個(gè)人助理、股票交易代理、企業(yè)內(nèi)自動(dòng)值守、旅游訂票系統(tǒng)和許多其他可實(shí)現(xiàn)語(yǔ)音功能的復(fù)雜應(yīng)用。在不遠(yuǎn)的未來(lái),在公網(wǎng)中更將出現(xiàn)象由大型詞匯表(一百萬(wàn)字條)支持的自動(dòng)目錄幫助、企業(yè)應(yīng)用托管,如語(yǔ)音門戶這樣的應(yīng)用。

技術(shù)使然

未來(lái)語(yǔ)音應(yīng)用的關(guān)鍵在于語(yǔ)音技術(shù)的發(fā)展。在過去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強(qiáng)的處理能力、更低的成本和實(shí)現(xiàn)自助溝通、連續(xù)語(yǔ)音的更強(qiáng)大技術(shù)推動(dòng)了這些進(jìn)步。Barging技術(shù)也已完善,可使主叫用戶根據(jù)提示進(jìn)行應(yīng)答,并且可識(shí)別用戶的應(yīng)答。自然語(yǔ)言功能的推出也對(duì)語(yǔ)音應(yīng)用的用途產(chǎn)生了極大影響。

服務(wù)提供商扮演的角色增多

除了新型技術(shù)的出現(xiàn)和原有技術(shù)的發(fā)展外,在當(dāng)今具有強(qiáng)大影響力的語(yǔ)音應(yīng)用發(fā)展大潮中,另外一個(gè)關(guān)鍵因素是技術(shù)供應(yīng)商變換了自己的角色。當(dāng)今的服務(wù)提供商(主要是過去的算法供應(yīng)商)已經(jīng)發(fā)展成為全方位的提供者,擁有大批人文因素設(shè)計(jì)、應(yīng)用分析、系統(tǒng)分析、語(yǔ)言學(xué)和電話應(yīng)用開發(fā)方面的專家,他們推出了廣泛的專業(yè)服務(wù),支持創(chuàng)建、部署和維護(hù)高級(jí)語(yǔ)音應(yīng)用的功能。

新型測(cè)試工具大大縮短了開發(fā)時(shí)間

應(yīng)用測(cè)試已經(jīng)大大改進(jìn),使技術(shù)供應(yīng)商開發(fā)可快速、持續(xù)部署的應(yīng)用成為可能。

現(xiàn)在,從一種新型應(yīng)用的基本研究設(shè)計(jì)開始,開發(fā)商就可謹(jǐn)慎地、小規(guī)模地進(jìn)行測(cè)試,然后將測(cè)試的結(jié)果不斷反饋運(yùn)用到開發(fā)過程中,直到可部署實(shí)際應(yīng)用為止。一旦一個(gè)應(yīng)用實(shí)際部署之后,開發(fā)商可將這一技能應(yīng)用到其他類似的應(yīng)用中,這樣,大規(guī)?焖俨渴鹦滦蛻(yīng)用變得更簡(jiǎn)單輕松。

同時(shí),技術(shù)開發(fā)商也投入了很多精力來(lái)開發(fā)可方便快速部署應(yīng)用的強(qiáng)力工具。對(duì)話應(yīng)用組件(DAC)便是這樣一種高級(jí)程序工具,它溶聚了大量從應(yīng)用對(duì)話設(shè)計(jì)和與經(jīng)常性用戶交互中獲得的大量寶貴經(jīng)驗(yàn)和知識(shí)。例如,DAC可包含小程序,這些小程序允許用戶從目錄中選擇項(xiàng)目、讓應(yīng)用程序收集信用卡號(hào)碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點(diǎn)和目的地的信息、或查看股票價(jià)格等。通過提供可再利用目標(biāo)程序中的專門技術(shù),DAC可大大縮短開發(fā)新型應(yīng)用的時(shí)間。過去需30人、數(shù)年才能開發(fā)出的應(yīng)用,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開發(fā)出來(lái)。

文本轉(zhuǎn)語(yǔ)音已經(jīng)實(shí)現(xiàn)

除了語(yǔ)音識(shí)別技術(shù)之外,文字轉(zhuǎn)換為語(yǔ)音(TTS)的技術(shù)也大大提高,成為促進(jìn)語(yǔ)音門戶發(fā)展的另一塊重要因素。過去由于語(yǔ)音轉(zhuǎn)換質(zhì)量差,阻礙了TTS的廣泛應(yīng)用,而最新一代的TTS技術(shù)顯著地提高了語(yǔ)音轉(zhuǎn)換的質(zhì)量。語(yǔ)言支持也得到很大的提高。此外,TTS現(xiàn)實(shí)應(yīng)用中至關(guān)重要的組件——處理“臟(不正規(guī))”數(shù)據(jù)的預(yù)處理器已經(jīng)開發(fā)出來(lái)?尚拚⑻幚碇T如首字母縮寫詞、縮略詞和聲調(diào)的電子郵件預(yù)處理器,也使通過電話閱讀電子郵件信息的應(yīng)用成為可能。

互聯(lián)網(wǎng)的發(fā)展

互聯(lián)網(wǎng)電子交易革命使人們對(duì)即時(shí)信息接入和強(qiáng)大的交易處理功能寄予厚望。為了滿足這種期望,業(yè)界在開發(fā)以HTML等腳本語(yǔ)言為基礎(chǔ)的基礎(chǔ)設(shè)施方面已經(jīng)開展了大量的工作。

新型具有語(yǔ)音功能的語(yǔ)言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴(kuò)展到電話上,F(xiàn)在,具有語(yǔ)音功能的語(yǔ)言不僅可以利用現(xiàn)有的基礎(chǔ)設(shè)施,并可對(duì)支持互聯(lián)網(wǎng)的整個(gè)基礎(chǔ)設(shè)施進(jìn)行補(bǔ)充,將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施擴(kuò)展到客戶機(jī)/服務(wù)器架構(gòu)中,其結(jié)果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠(yuǎn)程應(yīng)用來(lái)控制的、具有強(qiáng)大功能的語(yǔ)音服務(wù)器平臺(tái)。

具有語(yǔ)音功能的IVR的發(fā)展

可實(shí)現(xiàn)語(yǔ)音功能的交互式語(yǔ)音應(yīng)答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,您可考察一下利用800號(hào)碼提供主叫用戶接入服務(wù)的企業(yè)。最初的情況是用戶撥打800號(hào)碼,然后接到提供服務(wù)的人員處。但企業(yè)很快認(rèn)識(shí)到人員配備成本昂貴,許多工作可采用自動(dòng)處理方式,從而節(jié)約成本開支。IVR系統(tǒng)即可實(shí)現(xiàn)這種自動(dòng)處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫(kù)集成在一起,以便IVR系統(tǒng)可動(dòng)態(tài)地處理信息。這樣,主叫用戶利用計(jì)算機(jī)語(yǔ)音集成(CTI)技術(shù)接入企業(yè)的IVR系統(tǒng),之后,這一呼叫被IVR系統(tǒng)實(shí)時(shí)轉(zhuǎn)移到相關(guān)人員處,同時(shí),個(gè)性化的主叫用戶信息(比如未完成的訂貨情況)可通過彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務(wù)建立了堅(jiān)實(shí)的基礎(chǔ)。另外,通過使IVR系統(tǒng)前端具有語(yǔ)音功能,強(qiáng)大的ASR功能可使企業(yè)節(jié)省更多成本。

對(duì)主叫用戶而言,語(yǔ)音意味著更自然和更舒適的界面。可實(shí)現(xiàn)語(yǔ)音功能的IVR應(yīng)用也比雙音多頻(DTMF)、或按鈕應(yīng)用更方變。這將帶來(lái)更好的投資回報(bào)。

語(yǔ)音門戶網(wǎng)革命

到2001年,全球?qū)⒂?0億多部電話投入使用,任何企業(yè)都不應(yīng)該置身于這些用戶視線之外,否則后果不堪設(shè)想。企業(yè)非常需要借助語(yǔ)音門戶網(wǎng),向用戶提供接入服務(wù)。在服務(wù)提供商的基礎(chǔ)設(shè)施中添加的語(yǔ)音門戶網(wǎng),將從根本上改變企業(yè)與用戶“溝通”的方式,以及用戶與企業(yè)互動(dòng)的方式。