国产www视频,yellow中文字幕官网是,51精产国品一二三产区区别

基于VoiceXML技術的可視化IVR系統(tǒng)設計和實現(xiàn)(一)

上海易谷網(wǎng)絡科技有限公司查瑋 2009/09/22

摘要

　　為了縮短交互式語音應答(IVR: Interaction Voice Response)系統(tǒng)流程開發(fā)周期，克服傳統(tǒng)IVR系統(tǒng)業(yè)務流程編寫復雜的困難，同時與VoiceXML技術相結合，本文設計并實現(xiàn)了基于VoiceXML技術的可視化IVR系統(tǒng)。

　　本文設計的IVR系統(tǒng)，將整個系統(tǒng)分為流程編輯工具、含有VoiceXML標簽的Web頁面和執(zhí)行引擎三個部分，完成了總體框架及其核心部分的設計與實現(xiàn)。本文研究了可視化技術的現(xiàn)狀和理論，并對傳統(tǒng)IVR系統(tǒng)流程編輯工具做了分析與對比，并在此基礎上，從靈活、方便以及友好的用戶界面的設計原則出發(fā)，對IVR系統(tǒng)的流程工具進行了詳細的設計與實現(xiàn)。然后，在分析當前Web技術發(fā)展的情況下,本文與企業(yè)數(shù)據(jù)業(yè)務緊密結合，提出了將業(yè)務流程類比成企業(yè)門戶網(wǎng)站的解決方案。該方案結合OpenVXI開源項目，使用VoiceXML技術，設計并實現(xiàn)了IVR系統(tǒng)的執(zhí)行引擎。

關鍵詞：交互式語音應答可視化系統(tǒng) VoiceXML

第一章　緒論

　　1.1　研究背景

　　呼叫中心(Call Center，又稱客戶服務中心)起源于發(fā)達國家對服務質量的需求，其主旨是通過電話、傳真等形式為客戶提供迅速、準確的咨詢信息以及業(yè)務受理和投訴等服務，通過程控交換機的智能呼叫分配、計算機電話集成、自動應答系統(tǒng)等高效的手段和有經(jīng)驗的人工坐席，最大限度地提高客戶的滿意度，同時自然也使企業(yè)與客戶的關系更加緊密，是提高企業(yè)競爭力的重要手段[1]。

　　IVR(Interaction Voice Response，交互式語音應答)系統(tǒng)是整個呼叫中心的系統(tǒng)的最前端，它的質量直接影響到整個系統(tǒng)的穩(wěn)定性。在整個呼叫中心運行過程中，IVR系統(tǒng)的業(yè)務流程也在隨著客戶體驗和業(yè)務功能需求發(fā)生著改變，因此，如何對業(yè)務流程方便快捷的修改成了IVR系統(tǒng)必不可少的功能顯得尤為重要。相對于傳統(tǒng)的腳本式的編輯方法顯然不能很好的適應這樣的變化，所以可視化的配置方式呼之欲出，應用可視化的業(yè)務流程編輯界面可以很好與用戶交互，減輕了用戶的工作量，同時達到方便快鍵的目的。

　　同時，隨著IVR系統(tǒng)的發(fā)展，其與企業(yè)的數(shù)據(jù)業(yè)務結合的越來越緊密。而傳統(tǒng)的IVR系統(tǒng)相對于企業(yè)后臺數(shù)據(jù)業(yè)務服務相對隔離，而且大多數(shù)的IVR產(chǎn)品都不能很好的與企業(yè)的業(yè)務系統(tǒng)對接，或者是使用了比較繁冗復雜的方法，既浪費了資源，又影響了系統(tǒng)的穩(wěn)定性。VoiceXML技術的出現(xiàn)，使語音業(yè)務與數(shù)據(jù)業(yè)務得到了統(tǒng)一，節(jié)省了資源，用戶在訪問語音業(yè)務的時候也可以方便的訪問到數(shù)據(jù)業(yè)務。

　　1.2 國內(nèi)外研究現(xiàn)狀與應用前景

　　1.2.1 可視化技術的發(fā)展現(xiàn)狀和應用前景

　　可視化語言技術比一維文本語言在描述軟件組成方面具有優(yōu)越性．由于圖表和圖形概念在系統(tǒng)建模中的廣泛使用，可視化語言可以應用于需求分析、設計、測試和維護等軟件開發(fā)的各個階段[2]。

　　可視化建模語言簡稱可視化語言，是采用圖形方式對系統(tǒng)/軟件進行描述的語言，如目前廣為流行的統(tǒng)一建模語言UML、傳統(tǒng)的數(shù)據(jù)流語言和工作流建模語言等，它具有直觀、便于理解的優(yōu)點�？梢暬９ぞ邽榭梢暬ＵZ言的使用提供了工具支持，目前可分為兩大類：自由編輯型和語法制導型。自由編輯型允許用戶隨意建模，相當也圖形編輯器，如Microsoft(微軟)公司的Visio；語法制導的可視化建模工具在編輯過程中自動引導用戶建立語法正確的可視化模型，有利于用戶對可視化建模語言的掌握和使用，有著廣泛的使用范圍。

　　對于自由編輯型可視化建模工具，在國際市場上，Microsoft公司的Visio和Rational公司的Rose的產(chǎn)品比較有影響和代表性。

　　Visio是當今最優(yōu)秀的辦公繪圖軟件之一，它將強大的功能和簡單的操作完美地結合在一起。使用Visio，可以繪制業(yè)務流程圖、組織結構圖、項目管理圖、營銷圖表、辦公室布局圖、網(wǎng)絡圖、電子線路圖、數(shù)據(jù)庫模型圖、工藝管道圖、因果圖、方向圖等，因而，Visio被廣泛地應用于軟件設計、辦公自動化、項目管理、廣告、企業(yè)管理、建筑、電子、機械、通信、科研和日常生活等眾多領域。

　　Rational Rose [3]是一個完全的，具有能滿足所有建模環(huán)境(Web開發(fā)，數(shù)據(jù)建模，Visual Studio 和 C++)需求能力和靈活性的一套解決方案。Rose 允許開發(fā)人員，項目經(jīng)理，系統(tǒng)工程師和分析人員在軟件開發(fā)周期內(nèi)在將需求和系統(tǒng)的體系架構轉換成代碼，消除浪費的消耗，對需求和系統(tǒng)的體系架構進行可視化，理解和精練。通過在軟件開發(fā)周期內(nèi)使用同一種建模工具可以確保更快更好的創(chuàng)建滿足客戶需求的可擴展的、靈活的并且可靠的應用系統(tǒng)。

　　語法制導型的編輯器自動生成技術的研究成果主要有GENGED[4]、PROGRES[5]、MetaEdit+[6]；國內(nèi)的研究相對較少，從目前所發(fā)表的研究成果看，只有北航軟件工程研究所研制的SGEG 系統(tǒng)[7]。以上研究主要基于自動生成器的思想，由于在不同程度上缺乏對語言描述能力、語言解析效率、生成的目標編輯器的靈活性和可擴展性等方面的綜合考慮，所以實用性較弱。

　　1.2.2 VoiceXML技術的發(fā)展現(xiàn)狀與應用前景

　　VoiceXML(語音可擴展標記語言)的出現(xiàn)最早可以追溯到1995在AT&T公司開發(fā)的基于XML的電話標記語言(PML)。隨后，AT&T、Lucent Technologies以及Motorola公司分別各自著手開發(fā)自己的類似于PML的語音標記語言。到了1998年，W3C(world wide web consortium)組織的“語音瀏覽器”會議上，AT&T和Lucent Technologies分別展現(xiàn)了他們各自的類同PML的標記語言、Motorola和IBM公司分別推出VoxML[8]和SpeechML[9]、HP和PipeBeach公司也分別推出TalkML[10]和VoiceHTML[11]。AT&T、IBM、Lucent Technoglies、以及Motorola隨后成立了VoiceXML論壇，其目的是為了建立一個語音對話應用系統(tǒng)的國際標準。到了2000年，AT&T、IBM、Lucent Technologies、以及Motorola通過W3C協(xié)會聯(lián)合推出語音可擴展標記語言VoiceXML1.0。該標準一經(jīng)推出，便得到相關行業(yè)眾多公司的響應。經(jīng)過兩年多的論證和實際系統(tǒng)驗證，VoiceXML2.0最終草案在2003年推出。用VoiceXML開發(fā)的語音應用系統(tǒng)，不僅可以完全代替?zhèn)鹘y(tǒng)CTI(計算機電話集成) 系統(tǒng)所能提供的功能，而且還可以使應用系統(tǒng)開發(fā)過程極其簡單快捷、系統(tǒng)有極高的可擴展性、可維護性、可移植性、可重用性和開放性。其定義了如何使用語音識別、語音合成、互聯(lián)網(wǎng)訪問、數(shù)據(jù)庫訪問、語音文件播放、DTMF輸入等功能開發(fā)一個完整的語音應用系統(tǒng)。

　　1.3　論文研究內(nèi)容

　　隨著現(xiàn)代呼叫中心的發(fā)展，IVR系統(tǒng)的業(yè)務流程也愈趨復雜，在設計過程定義工具的時候簡化操作的復雜性，提高產(chǎn)品的易用性是首先應當考慮的。所以圖形化的過程定義工具顯得尤為必要。同時，人們在呼叫中心業(yè)務中，對于語音和數(shù)據(jù)業(yè)務相結合有了強烈的愿望，VoiceXML很好的解決了這個難題，其技術也在這幾年有了長足的發(fā)展，使得語音和數(shù)據(jù)業(yè)務有了一個良好的耦合。

　　為了實現(xiàn)簡單、易用能和數(shù)據(jù)業(yè)務良好整合的IVR系統(tǒng)，本課題圍繞以下幾項主要工作展開研究：

　　1．可視化的基本概念的研究。具體的研究內(nèi)容包括:可視化技術的定義，可視化建模語言的描述方法，閱讀并分析了大量有關可視化技術的資料及學術論文，對可視化技術的概念、特點進行詳細的討論和分析；

　　2．可視化的過程定義工具的研究。具體的研究內(nèi)容包括可視化過程定義工具的體系結構和過程定義工具的詳細設計和實現(xiàn)；

　　3．VoiceXML技術的基本概念的研究。具體的研究內(nèi)容包括：VoiceXML的概述,VoiceXML的基本體系結構和其在IVR系統(tǒng)中的簡單應用；

　　4．基于VoiceXML的執(zhí)行引擎的研究。具體的研究內(nèi)容包括：執(zhí)行引擎的體系結構的總體分析以及基于OpenVXI開源項目的執(zhí)行引擎的設計和實現(xiàn)。

　　1.4 本文結構

　　本文共分六部分，具體的內(nèi)容組織如下：

　　第一章：緒論。給出課題的研究背景，提出論文的目標、意義和主要研究內(nèi)容；

　　第二章：相關技術研究。第一部分，可視化技術概述。介紹了可視化技術的定義和建模語言描述方法等。第二部分，VoiceXML技術。介紹了VoiceXML技術的原理和在IVR系統(tǒng)的應用；

　　第三章：基于VoiceXML技術的可視化IVR系統(tǒng)分析和設計。首先分析了IVR系統(tǒng)的具體需求，提出了系統(tǒng)總體架構，分別論述了流程定義工具和執(zhí)行引擎的詳細設計；

　　第四章：基于VoiceXML技術的可視化IVR系統(tǒng)實現(xiàn)。重點介紹了過程定義工具及執(zhí)行引擎的實現(xiàn)；

　　第五章：IVR系統(tǒng)的應用及測試。給出了本問設計的系統(tǒng)的一個具體應用，并且給出了測試結果；
　　
　　第六章：結束語�？偨Y了本文工作所取得的成果，并對下一步工作提出了展望。

第二章　相關技術研究

　　由于IVR系統(tǒng)在呼叫中心系統(tǒng)中的前置性和必要性地位，同時IVR系統(tǒng)相關技術也引起了很高的關注。近年來，隨著軟件開發(fā)技術的日新月異，IVR系統(tǒng)相關技術也在不斷發(fā)展和完善，下面扼要的介紹一下IVR系統(tǒng)相關的可視化技術和VoiceXML技術的研究現(xiàn)狀和進展。

　　2.1 可視化技術綜述

　　2.1.1 可視化技術的研究

　　可視化建模工具的開發(fā)，其總體思路是利用模型驅動的方法，通過模型到代碼、模型到語言配置文件的自動映射，同時通過配置目標編輯器，實現(xiàn)可視化語言編輯器的自動生成。自動生成結合配置技術不僅使可視化語言編輯器的開發(fā)效率更高，而且更具靈活性。

　　總體框架分為三個部分(見圖2.1)：

　　1.模型，主要包括對目標語言(即可視化語言)的描述；

　　2.轉化模塊，將模型描述的信息轉化為代碼和語言配置文件；

　　3.目標編輯器的配置和自動生成，其基本設計思想是將所有可視化語言編輯器都共有的部分和變化的部分分離，由基礎框架實現(xiàn)共有部分，而變化部分采用自動生成和系統(tǒng)配置的方法實現(xiàn)。

　　因此目標編輯器由“可視化語言編輯器框架+語言構件+編輯器配置項”構成。可視化語言編輯器框架是目標編輯器的核心驅動部分，不涉及與任何目標可視化語言相關的代碼；語言構件包含了與目標可視化語言相關的目標代碼；配置項描述了對可視化語言和編輯器的定制。

圖2.1 可視化建模工具總體框架圖

　　根據(jù)總體框架，可視化建模工具開發(fā)環(huán)境主要包括以下兩個方面的研究：

　　(1)可視化建模語言的描述方法；
　　(2)目標編輯器的配置和實現(xiàn)。

　　2.1.2 可視化建模語言描述方法

　　可視化建模語言的描述方法是總體框架的基礎。分為三個部分：

　　1.語素—語素是最小的語法單位，可視化語言的語素表現(xiàn)為圖元符號(本文中不再區(qū)分語素和圖元)。

　　2.語法—語法定義了圖元符號之間的關系，包括兩個部分：抽象語法和具體語法。抽象語法定義圖元之間邏輯連接關系；具體語法定義圖元外觀的類型以及圖元之間幾何位置關系。

　　3.語義—語義表明了圖元符號和連接關系的含義，是模型的具體含義。

　　目前，大多數(shù)可視化建模語言描述的研究主要是針對語法描述研究，描述方法主要有基于文法的形式化描述、基于邏輯的形式化描述、基于代數(shù)的形式化描述和基于規(guī)則的半形式化描述方法[12]。一般分為兩大部分：基于規(guī)則的語法形式化描述和基于元模型技術的靜態(tài)語義描述。

　　(1)基于規(guī)則的語法描述方法(RGVL，Rule-based Grammar Visual Language)

　　基于規(guī)則的可視化建模語言描述方法(RGVL)具有如下優(yōu)點：

規(guī)則的解析效率高；

規(guī)則容易理解和書寫；

描述能滿足當前大多數(shù)的可視化建模語言需求。

　　RGVL采用一組規(guī)則來定義圖元與圖元之間的邏輯關系，并利用一組規(guī)則來描述圖元的位置關系等幾何信息。該描述方法形式上可以定義為一個三元組：
　　　　　　　　　　
　　　　　　　　　　　　　G={p,AG,CG}　　　　　　　　　　　式(2-1)

　　G 為可視化建模語言的語法，其中，
　　p：為一個有窮的圖元集合。形式表示為：
　　P={P/P為可視化建模語言中的基本圖元類型} 例如，UML類圖中的類和關聯(lián)類可以表示為：

　　　　　　　　　　　　　P{Class,Assiciaion}　　　　　　　式(2-2)

　　AG：抽象語法規(guī)則集合。形式表示為：

　　　　　　　　AG={r/r(p1,p2,n)p1€p,p2€p,n為自然數(shù)}　　　式(2-3)

　　r 為圖元之間的連接關系， r 可以為Connection_from 和Connection_to 兩種類型的關系， n表示連接的勢(多重性)； *表示無窮； Connection_from表示從p2 連接到p1 ，p1為當前圖元；Connection_to 表示從p1 連接到p2 ， p1為當前圖元。例如，在UML關聯(lián)關系的定義中，為了表示關聯(lián)關系與類之間的抽象語法關系，可以書寫如下的規(guī)則：

　　　　　　　　AG={Connection_to(Class,Associalion,*),
　　　　　　　　Connection_from(Class,Associalion,1)} 　　　　式(2-4)

　　表示類圖元可以連接多個關聯(lián)關系，每個關聯(lián)關系必須連接到一個類圖元。

　　CG：具體語法規(guī)則集合。形式表示為:

　　　　　　　　　　　CG={(p,render,lsyout)/p€P,render€R.layout€C}　　式(2-5)

　　R是圖元外觀類型的集合，L是圖元位置關系的集合。例如，

　　　　　　　　　　　CG={Class.MutiTextViz,AtLocation Layout}　式(2-6)

　　公式(2-6)表示類圖元具有帶有多個文本框的外觀類型和指定位置放置圖元的位置關系定義時，為了增強可擴展行,定義了用戶自定義類型(在實現(xiàn)時，定義了相關的編程接口使得用戶可以自定義外觀和圖元位置關系)。

　　(2)基于元模型的靜態(tài)語義描述方法(MSS)

　　將傳統(tǒng)的語義分為兩個部分：靜態(tài)語義和動態(tài)語義。靜態(tài)語義表示圖元符號的屬性信息，是可視化建模語言中一個重要組成部分。通過擴展元模型MOF(Meta Object Facility)技術對靜態(tài)語義進行定義。MOF是對象管理組織定義的一個用于在平臺無關方式下，定義、使用和集成元數(shù)據(jù)以及數(shù)據(jù)的模型驅動框架[13]。

　　利用MOF元模型對可視化建模語言的靜態(tài)語義進行描述時，MOF的表達能力還不足以滿足完整地描述可視化建模語言的語素(圖元)的靜態(tài)關系和操作關系，擴展了MOF中的關聯(lián)關系，在關聯(lián)中增加標簽值來專門說明該關聯(lián)與其它關聯(lián)之間的關系，提出了基于MOF的靜態(tài)語義描述方法稱為MSS(MOF-based Static Sematic)。該方法可以定義為一個三元組：

　　　　　　　　　　　　　　　MSS={m,Rs,Rop}　　　　　　　　　式(2-7)

　　MSS為可視化建模語言的靜態(tài)語義，其中，M：為擴展的MOF的靜態(tài)語義模型�？杀硎緸�

　　　　　　　　　　　　　　　M=CssURss　　　　　　　　　　　式(2-8)

　　Css表示元類的集合， Rss表示元類之間的關系集合。在Rss 中使用的是擴展后的關聯(lián)關系，可以定義關聯(lián)之間的關系。

　　Rs：為圖元與靜態(tài)語義模型中元類的靜態(tài)關系�？杀硎緸�

　　　　　　　　　　　　　　 Rs={(p,c)/p€P,C€Css}　　　　　　式(2-9)

　　公式(2-9)中 p為語素集合， Css為元類集合。

　　對于目標編輯器的配置和實現(xiàn)，主要是對可視化建模語言研究和分析后，根據(jù)實現(xiàn)的需要，同時考慮了解析能力和描述能力，定義了一套支持語義定義的可視化建模語言描述方法。

　　2.2 基于VoiceXML的交互式語音應答

　　2.2.1 VoiceXML概述

　　VoiceXML是W3C用來制定通過對話訪問Web的內(nèi)容及其交互語音應答的傳遞標準。VoiceXML使公共電話網(wǎng)、語音處理技術以及互聯(lián)網(wǎng)有機地結合為一體。它是一種域專用語言，定義了一系列的語音應用概念、元素及其對應的操作，能根據(jù)播放的音頻文件、輸出的文本語音、要錄制和識別的語音以及所接收的按鍵音，連定義人和計算機之間的語音交互過程。

　　VoiceXML希望通過交互式語音界面應用Web上已經(jīng)存在的大量信息，同時希望能夠將開發(fā)人員從最低級的編程和資源處理工作中解放出來。VoiceXML還能夠利用人們已經(jīng)非常熟悉的C/S,將語音服務和數(shù)據(jù)服務融合起來[14][15]。

　　2.2.2 VoiceXML基本體系結構

　　VoiceXML系統(tǒng)的基本結構如圖2.2所示[16]。其中，文檔服務器充當?shù)氖荳eb服務器的角色，他負責處理執(zhí)行平臺發(fā)送的請求文檔，并與后臺數(shù)據(jù)庫進行交互，組織VoiceXML文檔對該請求進行響應。
VoiceXML解析器上下文和VoiceXML解釋器負責解析VoiceXML文件，控制執(zhí)行平臺。執(zhí)行平臺提供合成語音的輸出(text to speech，TTS)、音頻文件的輸出、話音輸入的識別(automated speech recognition，ASR)、DTMF輸入識別、語音輸入的錄音、電話功能等[17]。

圖2.2 VoiceXML的基本體系結構圖

　　VoiceXML語言規(guī)范的層次結構如圖2.3[18]所示，層次從底向上依次升高。

圖2.3 VoiceXML層次結構

　　(1)Session。用戶開始和VoiceXML解析器進行交互式標志一次會話(Session)開始，繼續(xù)完成文檔獲取和處理，當用戶、文檔或者解釋器要求退出時，這次Session結束。

　　(2)Application。一個應用(Application)是指一系列文檔共享一個相同的應用文檔。當用戶和一個應用中的文檔交互時，它的應用根文檔同時被加載；當文檔跳轉到的另一個文檔也存在于同一個應用中，這時根文檔不被釋放當根文檔被加載后它的變量可以被其他子文檔使用。

　　(3)Dialog和SubDialog。每個VoiceXML 文檔都是一個交談的有限狀態(tài)自動機用戶某時只能在一個會話狀態(tài)Dialog ，它決定了下一個要執(zhí)行的Dialog 執(zhí)行時就是在Dialog 之間跳轉。

　　Dialog 分為兩種Form 和Menu。Form定義了一系列Field項目用于交互，每一個Field 可以使用Grammar 語法指定允許輸入的內(nèi)容。Menu 提供給用戶選擇然后根據(jù)用戶的選擇跳轉到指定的Dialog 中。

　　SubDialog 類似于函數(shù)調用，它提供一種機制允許激活一個新的交互，等交互完成后返回到原先的交互中去。使用SubDialog 可以實現(xiàn)一個特定模塊以便重復使用。

　　(4) Grammar。每個Dialog 都有至少一個語法(Grammar)。語法包括兩種：DTMF語法和語音語法。在機器導引方式中，只有當用戶處于這個Dialog 中，該Dialog 的Grammar 才是有效的；在混合方式中，有些Dialog可以標記為即使當前用戶不處于該Dialog 中，這個語法也是有效的。

　　(5)Event。VoiceXML提供了一種Form-Filling機制來處理通常的輸入，另外還需要處理一些事件。在有些情況下平臺會拋出一些事件，例如用戶無響應、超時或沒有正確響應、請求幫助等。如果解釋器發(fā)現(xiàn)語義錯誤，也會拋出事件。事件由Catch 元素來捕獲并作相應的處理。

　　2.2.3 在IVR系統(tǒng)中運用VoiceXML技術

　　VoiceXML的推出給電話語音系統(tǒng)帶來全新的應用和開發(fā)概念，使傳統(tǒng)的CTI技術從繁瑣、封閉的模式中走了出來，使廣大的語音系統(tǒng)開發(fā)人員可以用極其簡單的方法實現(xiàn)復雜系統(tǒng)的開發(fā)。同時VoiceXML技術突破地實現(xiàn)了互聯(lián)網(wǎng)與電話網(wǎng)的融合，在以語音為核心的電話網(wǎng)絡與以數(shù)據(jù)為核心的互聯(lián)網(wǎng)絡之間建立了良好的溝通“橋梁”。

　　到目前為止，人們從Internet獲取各種資源時，還只能是借助計算機來實現(xiàn)。而實際上，電話具有比計算機更高的普及率，如果允許人們通過電話來訪問Internet的資源，那么這對于Internet的應用發(fā)展必將是一次質的飛躍。在這類應用前景的驅動下，VoiceXML 1.0標準被提出來了，目前最新版本為2.1[19]。

　　VoiceXML使得用戶可以通過電話按鍵或語音來訪問Internet上的各種資源，它是語音瀏覽技術以及語音互聯(lián)網(wǎng)的核心。 VoiceXML為語音應用領域展現(xiàn)了一個廣闊的未來，用VoiceXML開發(fā)的語音應用系統(tǒng)，不僅可以完全代替?zhèn)鹘y(tǒng)CTI(計算機電話集成) 系統(tǒng)所能提供的功能，而且還可以使應用系統(tǒng)開發(fā)過程極其簡單快捷、系統(tǒng)有極高的可擴展性、可維護性、可移植性、可重用性和開放性，在語音門戶、語音呼叫中心(Call Center) 、語音信息服務、語音電子商務等領域有著廣泛的應用。

　　下面給出兩個簡單的例子說明VoiceXML在IVR系統(tǒng)的應用：

　　第一個是“Hello world”：

　　所有VoiceXML命令都封裝在……之間。VoiceXML對話框用戶描述腳本對用戶輸出的各種提示、定義和收集用戶的響應，并且描述程序控制的流程。對話框分兩種，分別是窗體(forms)和菜單(menus)。窗體輸出信息并且收集輸入，菜單提供下一步做什么選擇。這個例子有一個單一的窗體，它包括一個快(block)，該塊合成并輸出“Hello World！”。由于這個窗體沒有后繼的對話框，所以輸出完“Hello World！”后，腳本結束。

　　第二個例子要求用戶選擇一種飲料，并把用戶的選擇提交到服務器：

　　域(field)用于輸入。用戶在處理窗體中下一個元素之前，必須為一個域提供相應的信息。以上腳本的一個交互例子如下：

C(computer)：Would you like coffee, tea , milk, or nothing?
H(human) ：Orange juice。
C：I did not understand what you said.
C：Would you like coffee, tea , milk, or nothing?
H：Tea
C：(continues in document drink2.jsp)

　　通過這兩個例子可以看到，VoiceXML使用非常簡單。哪怕只是看幾個例子，就可以掌握一些基本的使用方法；而且它的特點正好符合用戶通過語音交互的業(yè)務特性，對聲訊業(yè)務支持近乎完美。

　　VoiceXML 2.0中共預定義了43個元素，按照功能可以分為文檔對話有關、資源功能類、事件處理類。文檔對話相關的元素主要實現(xiàn)信息表達、數(shù)據(jù)采集、變量賦值、條件控制、函數(shù)調用等功能；時間處理類元素主要實現(xiàn)產(chǎn)生、捕獲時間的功能，可進行錯誤處理、超時處理、幫助處理等；資源功能類元素主要實現(xiàn)錄、放音，TTS，ASR等與語音資源控制相關的功能，是對語音資源能提供功能的描述。

　　2.3　本章小結

　　本章首先闡述了可視化建模語言的總體框架，論述了可視化建模語言的描述方法。其次，介紹了VoiceXML技術的概念和基本體系結構，隨后描述了在IVR系統(tǒng)中VoiceXML技術的簡單應用。本章的內(nèi)容將為基于VoiceXML的IVR系統(tǒng)圖形化開發(fā)環(huán)境與執(zhí)行引擎設計和實現(xiàn)提供理論基礎。

基于VoiceXML技術可視化IVR設計和實現(xiàn)(二)

基于VoiceXML技術可視化IVR設計和實現(xiàn)(三)

基于VoiceXML技術可視化IVR設計和實現(xiàn)(四)

作者獨家提供CTI論壇稿件，其它媒體謝絕轉載

CTI論壇編輯

聯(lián)絡中心與3G應用 2009-04-09