首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

 

關(guān)于制定中國移動(dòng)互聯(lián)網(wǎng)語音應(yīng)用協(xié)議標(biāo)準(zhǔn)的建議

2001/03/11

一 引言

以互聯(lián)網(wǎng)為代表的信息產(chǎn)業(yè)為中國帶來了巨大的機(jī)會(huì)和挑戰(zhàn),中國社會(huì)開始進(jìn)入一個(gè)以信息為核心的時(shí)代。如何快速準(zhǔn)確地獲取所關(guān)心的信息,對人們的日常工作和生活已經(jīng)具有越來越重要的影響。

計(jì)算機(jī)作為互聯(lián)網(wǎng)絡(luò)的一種重要信息終端,是目前人們從互聯(lián)網(wǎng)上獲取信息的主要工具。然而,在計(jì)算機(jī)普及率、互聯(lián)網(wǎng)普及率以及教育程度相對較低的中國,使用計(jì)算機(jī)上網(wǎng),獲取信息和進(jìn)行通訊對于廣大百姓來說,還是一個(gè)神秘的期望。

至今為止,Internet 的訪問模式逐漸從單一的PC訪問方式向多種用戶終端發(fā)展 ,出現(xiàn)了移動(dòng)電話、PDA、機(jī)頂盒等。

如何解決信息產(chǎn)業(yè)化和社會(huì)發(fā)展水平之間的矛盾,依據(jù)中國具體國情,盡可能的實(shí)現(xiàn)信息技術(shù)的普及,促進(jìn)中國信息社會(huì)進(jìn)步的發(fā)展,使信息技術(shù)這樣的高科技輕松的進(jìn)入中國大多數(shù)百姓家,在中國具有巨大的市場前景和社會(huì)效益。

而近年來語音技術(shù)的飛速發(fā)展和不斷成熟,以及中文語音應(yīng)用技術(shù)的突破,為信息網(wǎng)絡(luò)帶來了一種極具誘惑的信息終端-----電話。

電話是中國百姓最為熟悉的通信工具,中國電話的普及率為全球第二,相對現(xiàn)今不到1000萬的互聯(lián)網(wǎng)電腦終端用戶來說,高達(dá)2億的電話用戶具有更為重要的意義。而語音應(yīng)用技術(shù),為中國百姓建立了一條輕松通達(dá)信息時(shí)代的高速公路,將信息科技以最為親切的方式帶到了人們身邊。

二 為何選擇語音應(yīng)用技術(shù)

語音應(yīng)用技術(shù),是連接互聯(lián)網(wǎng)的與電話用戶的紐帶,其使普通電話、手機(jī)等成為五花八門的網(wǎng)絡(luò)終端之一,并最大的擴(kuò)展了互聯(lián)網(wǎng)用戶。

2.1.語音與計(jì)算機(jī)

語音,是人類最為熟悉的交流方式。人有70%的信息獲取是通過聽,而90%的信息表達(dá)是通過說。語音是人們詢問問題,交換觀念、分享經(jīng)驗(yàn)和建立關(guān)系的最主要方式,人類通過語音傳達(dá)著大量的信息。

長期以來,人與計(jì)算機(jī)的交互主要是通過鍵盤、鼠標(biāo)和屏幕。雖然隨著圖形用戶界面(GUI)的日臻完善、各種輸入法的不斷出現(xiàn)和成熟,以及手寫輸入的應(yīng)用使人與計(jì)算機(jī)的交換越來越簡單方便,但追求完美和卓越的網(wǎng)絡(luò)時(shí)代,人們也愈加強(qiáng)烈地渴求一種更方便更自然的人機(jī)界面。而語音必然成為人們最為熟悉和輕松的人機(jī)交互方式。

2.2.語音技術(shù)

作為智能計(jì)算機(jī)研究的主導(dǎo)方向和人機(jī)通信的關(guān)鍵技術(shù),語音技術(shù)對計(jì)算機(jī)發(fā)展和社會(huì)生活的重要性日益凸現(xiàn)出來。作為語音技術(shù)中最主要的兩大技術(shù):語音識(shí)別技術(shù)(ASR)和語音合成技術(shù)(TTS),隨著近年來人們在數(shù)學(xué)算法和聲學(xué)模型取得的突破和飛速提高,語音識(shí)別和語音合成技術(shù)以及自然語言處理技術(shù)的成熟,使電腦能“說”,能“聽”,使人與機(jī)器的交流能象人與人之間對話一樣輕松和自然。

正如當(dāng)初圖形用戶界面(GUI)改變了個(gè)人電腦一樣,以語音技術(shù)為核心的語音用戶界面(VUI)正在改變著電腦和電話系統(tǒng),以及各種智能設(shè)備。

2.3.語音應(yīng)用技術(shù)

語音應(yīng)用技術(shù)(Voice Application Technology ),是指人們可以使用有線電話或移動(dòng)電話,以及PC、PDA和其它智能設(shè)備通過語音識(shí)別、語音合成的交互技術(shù),以及語音瀏覽、智能信息處理技術(shù)等實(shí)現(xiàn)人們訪問互聯(lián)網(wǎng)絡(luò),以及實(shí)現(xiàn)個(gè)人服務(wù)和商業(yè)服務(wù)的應(yīng)用技術(shù)。

語音應(yīng)用技術(shù),是語音技術(shù)(ASR和TTS TT)、語音瀏覽技術(shù)、智能文字信息處理技術(shù)等技術(shù)的集合,其形成一個(gè)完整的技術(shù)應(yīng)用規(guī)范體系,建立于已有相關(guān)技術(shù)協(xié)議標(biāo)準(zhǔn)上,著重于應(yīng)用開發(fā)。

語音應(yīng)用技術(shù)是跨接以語音為核心的電話網(wǎng)絡(luò)和以數(shù)據(jù)為核心的互聯(lián)網(wǎng)絡(luò)的一座橋梁,使有線電話和移動(dòng)電話成為互聯(lián)網(wǎng)絡(luò)信息終端,為人們以自然語言交互的方式來遨游信息信息打開了一扇自由的大門。語音應(yīng)用技術(shù)覆蓋語音識(shí)別、語音合成、語音瀏覽、語音集成、語音交互、Web服務(wù)等技術(shù)領(lǐng)域,可以輕松介入現(xiàn)有的網(wǎng)絡(luò)信息系統(tǒng),集成現(xiàn)有的各類信息處理技術(shù),如Web 、WAP、GPRS等等。

2.4.語音應(yīng)用技術(shù)的優(yōu)勢

為何語音應(yīng)用技術(shù)對于互聯(lián)網(wǎng)絡(luò),對于信息技術(shù)如此重要?首先,是因?yàn)殡娫挼闹匾浴k娫捲诘娜虬l(fā)達(dá)地區(qū)幾乎無所不在,時(shí)刻出現(xiàn)在人們身邊。電話的數(shù)量遠(yuǎn)遠(yuǎn)大于電腦的數(shù)量,更遠(yuǎn)大于連接了互聯(lián)網(wǎng)的電腦數(shù)量。尤其是在中國,電話相對電腦在更大程度上更是人們生活中最平常的設(shè)備。

隨著移動(dòng)電話越來越小,越來越輕,越來越便宜,以及移動(dòng)電話電池使用時(shí)間越來越長,其所具備的便攜性遠(yuǎn)勝于電腦。而伴隨移動(dòng)通信技術(shù)的飛速發(fā)展,他們更具備了電腦不具備的優(yōu)勢,比如全球定位。你甚至可以在開車時(shí)方便的使用移動(dòng)電話。

語音對于電話具有同樣的重要性,語音是電話的生命,是電信網(wǎng)絡(luò)的數(shù)據(jù)血液。雖然在移動(dòng)電話中出現(xiàn)了WAP這樣很有用的技術(shù),使移動(dòng)電話可以作為網(wǎng)絡(luò)終端,但WAP手機(jī)的屏幕太小而具有很大的局限性,在手機(jī)鍵盤上進(jìn)行輸入也相當(dāng)麻煩。雖然I-Mode系統(tǒng)正引人關(guān)注,但它同樣具有類似問題。

語音具有其獨(dú)特的優(yōu)勢,而且語音比鍵盤和閱讀更具親切感。當(dāng)然,圖象和文字依然很重要,我們相信,我們不久就可以見到“多模式”的設(shè)備,可以圖象和文字的方式進(jìn)行,或以語音的方式進(jìn)行,甚至可以混合語音和圖象。而這正是語音應(yīng)用技術(shù)帶來的美好情景。

同樣,語音對于Internet也一樣重要。首先,基于語音瀏覽技術(shù)的語音應(yīng)用系統(tǒng)的開發(fā)很容易,應(yīng)用應(yīng)用技術(shù)可以輕松建立豐富的、廉價(jià)的和高效的Web應(yīng)用,以及開發(fā)工具。其次,語音應(yīng)用系統(tǒng)很容易發(fā)布,不再需要建立一個(gè)指定的專用的語音服務(wù)器,基于語音瀏覽機(jī)制的語音應(yīng)用可以放在Internet 上的任意一個(gè)地方,而用戶通過電話,可以象使用IE這樣的瀏覽器一樣進(jìn)行查詢、書簽以及鏈接等其他Web的瀏覽方式。

而基于現(xiàn)有Web技術(shù)的語音Web服務(wù)技術(shù),具有現(xiàn)有Web技術(shù)的同樣優(yōu)勢,可以進(jìn)行安全交易、下載信息、收聽mp3等服務(wù)。且更為快捷和自然。

語音自然交互更具有其它信息終端不具備的優(yōu)勢,利用自然語音交互技術(shù),用戶不再需要一項(xiàng)一項(xiàng)的填寫Web的Form表單,不再需要痛苦的在小小的手機(jī)鍵盤上換著數(shù)字輸入名字和E-mail地址;陉P(guān)鍵字捕捉和自然語言處理技術(shù),用戶可以輕松的說一句:“我是注冊用戶 張三,請幫我查 深發(fā)展A 現(xiàn)在的股價(jià),發(fā)個(gè)短消息給我!币磺休p松自然。

2.5.語音應(yīng)用技術(shù)和移動(dòng)互聯(lián)網(wǎng)絡(luò)

Internet和移動(dòng)通信,作為邁向信息社會(huì)的兩個(gè)重要標(biāo)志分別對應(yīng)著對大量信息資源的有效訪問和隨處漫游的個(gè)人通信。如何結(jié)合它們的技術(shù)優(yōu)勢,在不受信息源的限制和用戶訪問時(shí)位置限制的同時(shí),以統(tǒng)一的標(biāo)準(zhǔn)向用戶提供無處不在的信息網(wǎng)絡(luò)服務(wù),已成為網(wǎng)絡(luò)界和電信界共同關(guān)注的一個(gè)焦點(diǎn)問題。

現(xiàn)在出現(xiàn)的WAP、GPRS、Mobile IP、Mobile IP Phone等等技術(shù),使移動(dòng)互聯(lián)網(wǎng)帶來了全新的概念。而應(yīng)用正是啟動(dòng)移動(dòng)互聯(lián)產(chǎn)業(yè)鏈的引擎,是連接移動(dòng)互聯(lián)與最終用戶的紐帶。而多種信息終端設(shè)備的出現(xiàn)和應(yīng)用以及多種數(shù)據(jù)通信技術(shù)的發(fā)展和應(yīng)用促進(jìn)了移動(dòng)互聯(lián)業(yè)務(wù)的普及與推廣,縮短了移動(dòng)互聯(lián)與最終用戶之間的距離,在個(gè)人定位、個(gè)人信用、人性化服務(wù)等方面開辟了新的發(fā)展空間。

語音應(yīng)用技術(shù)相比較WAP、GPRS等其它技術(shù),則更有利于移動(dòng)互聯(lián)網(wǎng)的普及和發(fā)展,體現(xiàn)了移動(dòng)互聯(lián)網(wǎng)絡(luò)的特性。語音應(yīng)用技術(shù)可以介入移動(dòng)互聯(lián)網(wǎng)絡(luò)幾乎所有的信息終端,其基于語音服務(wù)器和語音網(wǎng)關(guān)的體系結(jié)構(gòu)模型使得移動(dòng)新業(yè)務(wù)服務(wù)的開發(fā)和發(fā)布輕松而簡單,將原來基于Web的服務(wù)帶到了電話用戶和移動(dòng)用戶面前。

三 制定中國語音應(yīng)用協(xié)議標(biāo)準(zhǔn)的建議

語音應(yīng)用技術(shù)在中國,有著廣闊的前景和市場,對中國移動(dòng)互聯(lián)產(chǎn)業(yè)的建設(shè)和發(fā)展,促進(jìn)中國社會(huì)信息化,普及信息技術(shù)應(yīng)用有著重要的意義。

我們建議,制定我國有關(guān)于語音應(yīng)用技術(shù)的標(biāo)準(zhǔn)協(xié)議,以促進(jìn)中國語音應(yīng)用技術(shù)的發(fā)展,普及中國信息技術(shù)應(yīng)用,加速移動(dòng)互聯(lián)和網(wǎng)絡(luò)信息服務(wù)的產(chǎn)業(yè)化。做為中國漢語語音應(yīng)用技術(shù)的先行者和探索者,我們根據(jù)中國國情和漢語語音應(yīng)用的特點(diǎn),參考國際行業(yè)技術(shù)規(guī)范和標(biāo)準(zhǔn),綜合我們在長期的探索中的經(jīng)驗(yàn),提出語音應(yīng)用協(xié)議的規(guī)范建議。

3.1.定義

語音應(yīng)用協(xié)議(Voice Application Protocol ),是在互聯(lián)網(wǎng)絡(luò)和通信網(wǎng)絡(luò)(有線電話網(wǎng)絡(luò)和無線通信網(wǎng)絡(luò))基于語音技術(shù)開發(fā)應(yīng)用和服務(wù),以及相關(guān)設(shè)備的工業(yè)技術(shù)規(guī)范。語音應(yīng)用協(xié)議(VAP VA)制定了語音應(yīng)用的架構(gòu)和網(wǎng)絡(luò)協(xié)議,詳細(xì)說明語音終端設(shè)備(如電話、手機(jī)、內(nèi)嵌語音瀏覽器的智能設(shè)備、PC等)與網(wǎng)絡(luò)的通信協(xié)議和技術(shù)規(guī)范。該協(xié)議擴(kuò)展和協(xié)調(diào)了通信網(wǎng)絡(luò)技術(shù)(如移動(dòng)網(wǎng)絡(luò)數(shù)字通信標(biāo)準(zhǔn)和Internet技術(shù)(如XML、Web以及多種的信息內(nèi)容格式等)。該協(xié)議可以幫助移動(dòng)互聯(lián)網(wǎng)絡(luò)的運(yùn)營商、設(shè)備廠商、應(yīng)用開發(fā)商等建立基于語音方式的靈活、快捷、高效的服務(wù)。

3.2.動(dòng)機(jī)

語音應(yīng)用協(xié)議(VAP VA)定位于通信網(wǎng)絡(luò)和Internet的聚覺點(diǎn),制定以語音的方式提供兩者通訊和為龐大的電話用戶和飛速發(fā)展的互聯(lián)網(wǎng)絡(luò)用戶提供快捷、方便、自然的語音應(yīng)用服務(wù)。

語音應(yīng)用的特征是以非形象的信息方式-----聲音為信息表征,其終端設(shè)備局限于電話和手機(jī)等簡單輸入設(shè)備。可以利用的人機(jī)對話工具只有話筒、聽筒、數(shù)字鍵盤,以及手機(jī)屏幕。由于人對語音信息較快的反應(yīng)能力和弱的記憶力,決定了語音應(yīng)用的信息呈現(xiàn)方式必須簡短和簡單。

利用語音應(yīng)用協(xié)議的相關(guān)技術(shù),可以提供給客戶方便、輕松、自然的對話式的用戶界面,為簡易終端(電話、手機(jī))的用戶提供Internet上的信息和服務(wù),以及語音電子商務(wù)和個(gè)性化電信服務(wù)等等。

使用簡易的語音終端設(shè)備,可以實(shí)現(xiàn)例如以下的語音應(yīng)用:

3.3.需求

根據(jù)語音應(yīng)用技術(shù)的特性和應(yīng)用,語音應(yīng)用協(xié)議(VAP)的需求如下:

3.4.體系結(jié)構(gòu)

語音應(yīng)用協(xié)議的體系結(jié)構(gòu)類似于WWW的體系結(jié)構(gòu)和WAP的體系結(jié)構(gòu),圖一是WWW的體系結(jié)構(gòu):

而下圖(圖二)是WAP的體系結(jié)構(gòu)模型:

類似的,我們可以看到語音應(yīng)用協(xié)議(VAP)的體系機(jī)構(gòu)模型如下:

語音應(yīng)用協(xié)議(VAP VA)定義了終端--?網(wǎng)關(guān)--?服務(wù)器的體系結(jié)構(gòu)。語音服務(wù)器(Voice Server )是語音應(yīng)用的服務(wù)器,其包含語音應(yīng)用和數(shù)據(jù)、內(nèi)容;與WAP體系結(jié)構(gòu)不同的是,語音網(wǎng)關(guān)(Voice Gateway) 做為終端和語音應(yīng)用服務(wù)器的橋梁,作為語音應(yīng)用協(xié)議中的重要部分:語音瀏覽器(Voice Browser)建于語音網(wǎng)關(guān)(Voice Gateway)內(nèi),而不象WAP協(xié)議中,micro browser 建于終端中。這是因?yàn)檎Z音終端過于簡單以及語音數(shù)據(jù)可以通過電信網(wǎng)絡(luò)輕松與語音網(wǎng)關(guān)(Voice Gateway)交互。

語音應(yīng)用協(xié)議(VAP)定義了:

3.5.組成部分

語音應(yīng)用協(xié)議(VAP VA)也有一個(gè)類似于TCP/IP和WAP的層次結(jié)構(gòu),如下圖(圖四)所示:

語音應(yīng)用協(xié)議不僅僅為實(shí)現(xiàn)語音應(yīng)用技術(shù)而設(shè)計(jì),它的設(shè)計(jì)中使語音應(yīng)用可以操作多種不同的應(yīng)用,如短消息、WAP等。其在每個(gè)層次上都提供擴(kuò)展性的已定義好的接口,使其不僅僅限制于語音應(yīng)用協(xié)議(VAP)所描述和定義的范圍內(nèi)。

四 語音應(yīng)用協(xié)議方案的好處

語音應(yīng)用協(xié)議(VAP)用以實(shí)現(xiàn)互聯(lián)網(wǎng)絡(luò)與有線電話、移動(dòng)電話等簡單終端進(jìn)行交互,將信息應(yīng)用技術(shù)和服務(wù),以及移動(dòng)互聯(lián)服務(wù)最大限度的帶到用戶身邊。其關(guān)注于語音應(yīng)用服務(wù)的開發(fā)和實(shí)現(xiàn),將為為移動(dòng)互聯(lián)和信息服務(wù)帶來巨大影響。

4.1.提供了良好的用戶界面模型

作為最為親切友好的人機(jī)界面交互方式,語音應(yīng)用協(xié)議(VAP)為電話終端以及其它終端提供了遨游信息世界良好的擁護(hù)界面。傳統(tǒng)的鍵盤、鼠標(biāo)和屏幕為自然對話的交互方式所代替。語音應(yīng)用協(xié)議(VAP)不僅僅通過語音交互協(xié)議、語音標(biāo)記語言、對話標(biāo)記語言和語音瀏覽器規(guī)范等定義了“說”和“聽”的交互界面,而且語音應(yīng)用協(xié)議(VAP)使用已有的Internet模型作為起點(diǎn),提供了和在傳統(tǒng)PC機(jī)的瀏覽器一樣熟悉的Web瀏覽習(xí)慣。

同時(shí)通過數(shù)據(jù)轉(zhuǎn)換協(xié)議、語音控制協(xié)議等協(xié)議,提供了兼容WAP的電話鍵盤輸入的界面。而可以內(nèi)嵌于智能終端設(shè)備中的語音控制器和微型語音瀏覽器,可以使用戶不僅以對話方式獲取信息和服務(wù),而且可以用語音指揮終端設(shè)備,做到“聽、說、看”的全面交互。

4.2.提供了語音技術(shù)與信息技術(shù)的集成規(guī)范

語音應(yīng)用協(xié)議(VAP)中,語音網(wǎng)關(guān)(Voice Gateway)中制定的語音瀏覽器規(guī)范,作為應(yīng)用協(xié)議的語音標(biāo)記語言的解釋器,語音瀏覽器解析 Voice XML 所描述的應(yīng)用。而作為語音識(shí)別語法描述規(guī)范的JSGF規(guī)范和VAP語音識(shí)別引擎接口規(guī)范(基于JSAPI和SAPI)使人機(jī)間的交互以一種自然的,對話式的方式進(jìn)行。語音應(yīng)用協(xié)議(VAP)的這些規(guī)范對于對話瀏覽和語音識(shí)別、合成引擎之間的工作和數(shù)據(jù)交換等集成電路工作提供了標(biāo)準(zhǔn)。而語音瀏覽器、語音合成、識(shí)別引擎、CTI平臺(tái)之間的集成開發(fā)工作變得輕松而規(guī)范。

4.3.提供了安全的連接

語音應(yīng)用協(xié)議(VAP)對語音認(rèn)證、語音數(shù)字簽名等安全制定了協(xié)議,使語音應(yīng)用和語音電子商務(wù)的交易和安全更有保障。在基于Web機(jī)制的Transport Layer Security (TLS)協(xié)議基礎(chǔ)上,語音引協(xié)議(VAP)增加了在電話網(wǎng)絡(luò)中基于語音數(shù)據(jù)的安全機(jī)制以及基于個(gè)人聲紋認(rèn)證的安全驗(yàn)證。在語音應(yīng)用協(xié)議(VAP)中,語音網(wǎng)關(guān)(Voice Gateway)自動(dòng)的高度覺察性的管理數(shù)據(jù)安全。

4.4.提供了容易簡單的應(yīng)用開發(fā)機(jī)制和工具

利用語音標(biāo)記語言(Voice XML),用開發(fā)HTML頁面和Web應(yīng)用的方式就可以簡單的開發(fā)復(fù)雜的語音應(yīng)用。Voice XML 是一種XML文檔語言,其與數(shù)據(jù)庫、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)的資料交換幾乎沒有障礙。而語音應(yīng)用協(xié)議(VAP)中使用http協(xié)議作為語音網(wǎng)關(guān)(Voice Gateway)與語音服務(wù)器(Voice Server)之間的通訊協(xié)議,所以在Web所能使用的CGI、Perl、ASP等動(dòng)態(tài)數(shù)據(jù)機(jī)制同樣適用于語音應(yīng)用。而語音應(yīng)用交換方式基于java 的設(shè)計(jì),使Jsp 這樣的動(dòng)態(tài)數(shù)據(jù)機(jī)制可以更容易的應(yīng)用于語音應(yīng)用。

五 獲益者

語音應(yīng)用協(xié)議(VAP)不僅僅使廣大電話和手機(jī)用戶獲得輕松快捷享受信息服務(wù)和移動(dòng)互聯(lián)服務(wù),而且為整個(gè)社會(huì)和信息產(chǎn)業(yè)帶來更大的效益。

5.1.服務(wù)提供商的獲益

不僅僅信息服務(wù)的提供商可以為他們現(xiàn)有的信息服務(wù)系統(tǒng)增加語音應(yīng)用服務(wù)和龐大的用戶群,而且電信運(yùn)行商將從語音應(yīng)用為他們帶來的增值服務(wù)中獲得巨大收益。語音應(yīng)用的普及和推廣,必然使語音話務(wù)通訊的數(shù)量大大增加。而個(gè)性化的自然親切的語音應(yīng)用,將為服務(wù)提供商帶來巨大的新的服務(wù)內(nèi)容和語音電子商務(wù)行為。

而依靠Voice XML和對話標(biāo)記語言(Dialog-ML),服務(wù)提供商可以用開發(fā)Web服務(wù)一樣簡單的方式開發(fā)他們的語音應(yīng)用,并可以輕松發(fā)布和維護(hù)。而語音應(yīng)用協(xié)議(VAP)帶來電話服務(wù)語音應(yīng)用(例如個(gè)人撥號服務(wù)、電話會(huì)議、電話遠(yuǎn)程管理等)將為電信服務(wù)商帶來巨大商機(jī)。

5.2.設(shè)備廠商的獲益

集成語音應(yīng)用協(xié)議(VAP)中語音控制器的智能終端,以及內(nèi)嵌微型語音瀏覽器的信息終端設(shè)備,將為設(shè)備生產(chǎn)廠商帶來新的產(chǎn)品和收入。而智能語音家電設(shè)備、遠(yuǎn)端控制設(shè)備等將更為廣大用戶所關(guān)注。語音應(yīng)用協(xié)議(VAP)產(chǎn)生了大量新的語音應(yīng)用的產(chǎn)品,將為設(shè)備廠商帶來廣闊的市場。

5.3.開發(fā)商的收益

語音應(yīng)用的開發(fā)商也許將無法估計(jì)他們從語音應(yīng)用中獲得的收益,以語音應(yīng)用協(xié)議(VAP)為工業(yè)標(biāo)準(zhǔn)而進(jìn)行開發(fā),他們將能輕松的開發(fā)各種各樣的豐富的語音應(yīng)用系統(tǒng)。而作為語音技術(shù)產(chǎn)品的開發(fā)商,如語音識(shí)別、語音合成引擎的開發(fā)商,語音瀏覽器開發(fā)商,語音網(wǎng)關(guān)開發(fā)商等等,他們將不再需要自己解決語音應(yīng)用系統(tǒng)中的所有其它他們不關(guān)心的部分,統(tǒng)一的規(guī)范使他們可以自由的選擇其它部分配合自己的開發(fā)。而語音應(yīng)用協(xié)議(VAP)也為開發(fā)商帶來了簡單的開發(fā)規(guī)范和工具。

六 未來展望

我們可以預(yù)見,在不久的將來電話作為信息訪問的終端將遠(yuǎn)遠(yuǎn)超過電腦的數(shù)量。語音應(yīng)用技術(shù)將成為統(tǒng)一信息、統(tǒng)一網(wǎng)絡(luò)的移動(dòng)互聯(lián)中的重要技術(shù)成分。作為高科技的網(wǎng)絡(luò)信息對廣大的中國百姓將不在神秘,中國百姓將隨時(shí)隨地在對電話機(jī)或手機(jī)說話,享受語音應(yīng)用技術(shù)為他們帶來的美好服務(wù)。



相關(guān)鏈接:
基于VoiceXML 的應(yīng)用系統(tǒng)規(guī)范提綱(征求意見稿 2001-11-12
語音互聯(lián)再造Internet 2001-10-22
語音系統(tǒng)開發(fā)的新平臺(tái):VoiceXML瀏覽器 2001-10-19
TTS與語音識(shí)別軟件 2001-09-21
Office XP中文語音功能的開發(fā) 2001-09-13