Speech · Means · Business 語(yǔ)音 · 表示 · 商機(jī)
——NUANCE 公司亞太區(qū)總經(jīng)理康麥克先生

2002/07/29

    十年前, " Speech · Means · Business 語(yǔ)音 · 表示 · 商機(jī) ", 可能會(huì)有好多人覺(jué)得是天方夜談, 但時(shí)至今時(shí)今日, 再也沒(méi)有人會(huì)否定這句話(huà), 因?yàn)槭聦?shí)已經(jīng)證明了一切。

    今年五月初, 在美國(guó)奧蘭多,佛羅里達(dá)州 ( Orlando, Florida ) 舉行了一年一度的 V-World 2002,一個(gè)具有全球代表性的語(yǔ)音應(yīng)用國(guó)際會(huì)議。來(lái)自超過(guò)30個(gè)不同的國(guó) 家及地區(qū)的與會(huì)人仕當(dāng)中,自然少不了中國(guó)、日本、以及韓國(guó)等地,其中占有大部份是來(lái)自電訊運(yùn)營(yíng)商及與其業(yè)務(wù)相關(guān)連的平臺(tái)或方案供應(yīng)商的代表。他們參加會(huì)議的主要目的已經(jīng)由從前過(guò)去的為了解語(yǔ)音應(yīng)用技術(shù),改變?yōu)楝F(xiàn)在的學(xué)習(xí)及尋找如何在他們各自業(yè)務(wù)應(yīng)用上,去應(yīng)用已成熟的語(yǔ)音技術(shù)的實(shí)際例子,以及業(yè)務(wù)項(xiàng)目的執(zhí)行經(jīng)驗(yàn),從而去強(qiáng)化及豐富其本身業(yè)務(wù),為企業(yè)帶來(lái)更大的收益。

    作為在全球電訊級(jí)別上,語(yǔ)音識(shí)別技術(shù) (Automatic Speech Recognition, ASR),聲 紋鑒別技術(shù) (Voice Authentication),語(yǔ)音合成技術(shù) (Text-To-Speech, TTS),及 VoiceXML技術(shù)的領(lǐng)導(dǎo)者,NUANCE公司承諾繼續(xù)投放大量資源在嶄新語(yǔ)音技術(shù)的研究及開(kāi)發(fā)上,去推動(dòng)市場(chǎng)的認(rèn)可,保證業(yè)務(wù)運(yùn)營(yíng)商能提供高質(zhì)量的語(yǔ)音自助服務(wù)方案,并去協(xié)助運(yùn)營(yíng)商強(qiáng)化其本身業(yè)務(wù)以達(dá)至高成本效益的目標(biāo)。

    NUANCE公司占有全球性語(yǔ)音識(shí)別自助服務(wù)市場(chǎng)的主要份額,客戶(hù)超過(guò)600個(gè),累積市場(chǎng)份額超過(guò)64%。全球性500個(gè)最大型企業(yè),當(dāng)中就有超過(guò)20%是NUANCE公司的客戶(hù)。而集中在世界性的頂級(jí)電訊運(yùn)營(yíng)商中,NUANCE公司就占有80%的份額,可見(jiàn)NUANCE公司的技術(shù)是獲得全球電訊業(yè)界的認(rèn)同及廣泛支持。本年的首兩個(gè)季度,在中國(guó),包括香港及臺(tái)灣地區(qū),固網(wǎng)及移動(dòng)業(yè)務(wù)的運(yùn)營(yíng)商紛紛推出了各自的語(yǔ)音增值業(yè)務(wù),項(xiàng)目的規(guī)模已再不是幾十線的試用階段,而是上佰線,甚至超過(guò)仟線的投產(chǎn)商用業(yè)務(wù)系統(tǒng),系統(tǒng)當(dāng)然是采用了NUANCE公司最先進(jìn)的語(yǔ)音識(shí)別引擎及VoiceXML技術(shù)。

    現(xiàn)在,讓我與大家一同分享我們NUANCE公司在電訊領(lǐng)域方面的一些語(yǔ)音應(yīng)用心得;旧,在電訊領(lǐng)域運(yùn)營(yíng)商方面,語(yǔ)音應(yīng)用是可以非常廣泛。以下讓我們來(lái)看看其中一些最熱門(mén)的類(lèi)別:

  • Voice Activated Dialing (VAD) 語(yǔ)音撥號(hào)

  • Unified Messaging (UM) 統(tǒng)一信息

  • Personal Assistants 個(gè)人助理

  • Voice Portal 語(yǔ)音門(mén)戶(hù)


  •     最后,還會(huì)詳細(xì)地與大家分享一個(gè)NUANCE公司在VAD語(yǔ)音撥號(hào)類(lèi)別上非常成功的真實(shí)個(gè)案:" Sprint PCS Voice Command 個(gè)人語(yǔ)音電話(huà)簿業(yè)務(wù) "。

    Voice Activated Dialing (VAD) 語(yǔ)音撥號(hào)

        基于在語(yǔ)音識(shí)別技術(shù)準(zhǔn)確度上已有突破性的進(jìn)展,以語(yǔ)音撥號(hào),即用說(shuō)話(huà)方式直接講出對(duì)方姓名或電話(huà)號(hào)碼,去代替按鍵式撥號(hào),已經(jīng)成為其中一種可讓用戶(hù)打電話(huà)最方便的方法,也成為其中一種用戶(hù)最想要的增值服務(wù)。全球正關(guān)心如何使汽車(chē)駕駛更安全,以及有關(guān)在汽車(chē)內(nèi)駕駛者使用移動(dòng)電話(huà)時(shí)必須采用免提方式的立法事宜,這種種都驅(qū)使運(yùn)營(yíng)商去發(fā)展語(yǔ)音撥號(hào)相關(guān)的業(yè)務(wù)。在Yankee Group的周年移動(dòng)用 戶(hù)調(diào)查中,發(fā)現(xiàn)VAD語(yǔ)音撥號(hào)已成為其中一個(gè)前頭三位用戶(hù)最想獲得進(jìn)一步增強(qiáng)的服務(wù)。到2003年,估計(jì)VAD語(yǔ)音撥號(hào)業(yè)務(wù)會(huì)為運(yùn)營(yíng)商從零售用戶(hù)方便帶來(lái)約 3億 2仟 7佰萬(wàn)美元的收益, 同時(shí)也會(huì)吸引上仟萬(wàn)的使用者。 早期因?yàn)檎Z(yǔ)音識(shí)別技術(shù)尚 不夠成熟,以致運(yùn)營(yíng)商的VAD語(yǔ)音撥號(hào)相關(guān)業(yè)務(wù)不能大力的拓展,令他們感到非常失望。但現(xiàn)在,在NUANCE公司語(yǔ)音技術(shù)迅速的進(jìn)展情況下,VAD語(yǔ)音撥號(hào)相關(guān)業(yè)務(wù)終于能真正的實(shí)現(xiàn),而且能獲得眾多運(yùn)營(yíng)商的支持,以及廣大最終用戶(hù)的接受。現(xiàn)時(shí),為爭(zhēng)奪VAD語(yǔ)音撥號(hào)在固網(wǎng)或移動(dòng)的龐大市場(chǎng),各運(yùn)營(yíng)商都按本身業(yè)務(wù)發(fā)展的策略及時(shí)間表,積極地計(jì)劃及展開(kāi)大規(guī)模相關(guān)業(yè)務(wù)及其推廣。

        運(yùn)營(yíng)商在評(píng)估語(yǔ)音識(shí)別引擎技術(shù)時(shí),都會(huì)確定語(yǔ)音識(shí)別引擎廠商是否能滿(mǎn)足并符合相關(guān)業(yè)務(wù)上的要求,比如說(shuō)廠商必須有確實(shí)的經(jīng)驗(yàn),將語(yǔ)音識(shí)別技術(shù)用于所有的標(biāo)準(zhǔn)固網(wǎng),及移動(dòng)網(wǎng)絡(luò),如CDMA,TDMA,GSM等。同時(shí),技術(shù)也必須要支持混合模式的業(yè)務(wù)應(yīng)用,即Speaker-trained講話(huà)者受訓(xùn)式及Speaker-independent講話(huà)者非 依賴(lài)式的混合使用方式。以上種種的語(yǔ)音技術(shù)及廠商經(jīng)驗(yàn),都成為運(yùn)營(yíng)商是否能真正成功推動(dòng)一個(gè)高準(zhǔn)確度及高效率的VAD語(yǔ)音撥號(hào)業(yè)務(wù)的關(guān)鍵點(diǎn),最終能讓使用者接受,感覺(jué)方便、好用,從而獲得相關(guān)業(yè)務(wù)的成功,帶來(lái)龐大的收益。在這方面,NUANCE公司確實(shí)幫助了他們實(shí)現(xiàn)這個(gè)夢(mèng)想。

    Unified Messaging (UM) 統(tǒng)一信息

        網(wǎng)絡(luò)技術(shù)的進(jìn)步,互聯(lián)網(wǎng)使用率的持續(xù)上升,帶動(dòng)了在商務(wù)以及個(gè)人通訊方面的融合,有著巨大的增長(zhǎng)。一個(gè)完全語(yǔ)音用戶(hù)界面Voice User Interface (VUI) 將會(huì)最終 能夠在任何地點(diǎn)、時(shí)間、環(huán)境之下,讓用戶(hù)讀取自己的統(tǒng)一信息 --- 即可以組合及 管理所有來(lái)自不同渠道的通訊源,將其轉(zhuǎn)化為單一數(shù)據(jù)源。透過(guò)撥打一個(gè)電話(huà)號(hào)碼,用戶(hù)即可讀取、收聽(tīng)、回復(fù)來(lái)自不同源頭的電郵以及語(yǔ)音留言,簡(jiǎn)化了需要一定透過(guò)計(jì)算機(jī)終端,或需撥打多個(gè)不同的語(yǔ)音留言及自動(dòng)語(yǔ)音應(yīng)答系統(tǒng)的電話(huà)號(hào)碼。OVUM顧問(wèn)報(bào)告的保守估計(jì),到2003年,全球?qū)?huì)約有9仟5佰萬(wàn)美元價(jià)值的統(tǒng)一信息系統(tǒng)。

    Personal Assistants 個(gè)人助理

        擁有自己的個(gè)人秘書(shū),無(wú)疑是有數(shù)之不盡的好處。每個(gè)人當(dāng)然會(huì)喜歡有人幫助自己去管理,以及組織自己的一切約會(huì)、電話(huà)來(lái)電或呼出、還有信息上的需要。但是,以今天的經(jīng)濟(jì)環(huán)境及氣候,每個(gè)企業(yè)都想著如何縮減運(yùn)作成本,個(gè)人秘書(shū)就只會(huì)有高級(jí)管理層人員才有機(jī)會(huì)可以考慮。一般的雇員,就只得共享一名助理,或需要自己處理一切事宜。如果有一具有語(yǔ)音用戶(hù)界面的自動(dòng)私人助理為你安排一切,這就會(huì)非常理想。一個(gè)豐富的個(gè)人助理服務(wù)能夠?yàn)檫\(yùn)營(yíng)商創(chuàng)造出一個(gè)非常特出的競(jìng)爭(zhēng)優(yōu)勢(shì),爭(zhēng)取更多客戶(hù),帶來(lái)更大收益。服務(wù)還可以配合運(yùn)營(yíng)商本身的品牌去作大規(guī)模的推廣,這也會(huì)有助于在市場(chǎng)上推動(dòng)更大的服務(wù)需求。

    Voice Portal 語(yǔ)音門(mén)戶(hù)

        不論在固網(wǎng)或移動(dòng)電話(huà)業(yè)界,一個(gè)能夠?yàn)橛脩?hù)提供準(zhǔn)確和及時(shí)信息的服務(wù),已被證實(shí)能為運(yùn)營(yíng)商帶來(lái)業(yè)務(wù)的成功,及額外可觀的收益。用戶(hù)會(huì)有規(guī)律地重復(fù)使用該服務(wù)去獲取最新的信息,如天氣預(yù)測(cè)、道路情況、體育賽果、商業(yè)新聞等。語(yǔ)音門(mén)戶(hù)提供在眾多信息源頭的整合價(jià)值,同時(shí)也可為用戶(hù)提供一系列具有個(gè)性化的應(yīng)用,如日程表安排及個(gè)人信息服務(wù)等。其業(yè)務(wù)模式大至上跟Web Portal互聯(lián)網(wǎng)門(mén)戶(hù)差不 多,如Yahoo。語(yǔ)音門(mén)戶(hù)采用語(yǔ)音識(shí)別技術(shù),讓用戶(hù)能夠輕易地以說(shuō)話(huà)方式在眾多不同品種的信息清單上導(dǎo)航。這樣一來(lái),用戶(hù)就不必要通過(guò)計(jì)算機(jī)終端上網(wǎng),才可查看如某套電影在那所電影院播放、播影時(shí)間在何時(shí)等;用戶(hù)只需撥打語(yǔ)音門(mén)戶(hù)服務(wù)號(hào)碼,并說(shuō) "這套XXX電影在那里及何時(shí)播影" 便可。與現(xiàn)時(shí)Web Portal互聯(lián)網(wǎng) 門(mén)戶(hù)的分別,在于要接駁到語(yǔ)音門(mén)戶(hù),只要找到最接近你的電話(huà)或手提電話(huà)即可;還有,你也無(wú)需等待上網(wǎng)時(shí)信息下載相對(duì)緩慢的速度。語(yǔ)音門(mén)戶(hù)的確能為運(yùn)營(yíng)商刺激起網(wǎng)絡(luò)的使用率,預(yù)計(jì)語(yǔ)音門(mén)戶(hù)的數(shù)量將會(huì)在未來(lái)數(shù)年有著大幅度增加的趨勢(shì),而運(yùn)營(yíng)商本身更是其中占最大部份的業(yè)務(wù)營(yíng)運(yùn)機(jī)關(guān)。

    真實(shí)個(gè)案—— Sprint PCS Voice Command 個(gè)人語(yǔ)音電話(huà)簿業(yè)務(wù)

        在 2000年 8月,美國(guó)第4大移動(dòng)電話(huà)運(yùn)營(yíng)商 Sprint PCS 成功推出了 Sprint PCS Voice Command,一個(gè)具有語(yǔ)音撥號(hào)功能的個(gè)人語(yǔ)音電話(huà)簿業(yè)務(wù)。業(yè)務(wù)推出后不到1年,約9到10個(gè)月左右,已經(jīng)占有Sprint PCS其本身約1仟4佰萬(wàn)用戶(hù)當(dāng)中的10%滲透率, 即約有1佰4拾萬(wàn)用戶(hù)使用,每個(gè)用戶(hù)需要支付月費(fèi),帶來(lái)可觀的投資回報(bào)。該服務(wù)讓使用者以Speaker-independent講話(huà)者非依賴(lài)方式,即無(wú)需預(yù)先訓(xùn)練語(yǔ)音識(shí)別引擎 ,講出想接駁對(duì)方的姓名,系統(tǒng)便會(huì)自動(dòng)為你接駁。每個(gè)用戶(hù)的電話(huà)簿姓名名單可達(dá)至500個(gè),而每個(gè)個(gè)別姓名可以同時(shí)擁有最多5個(gè)不同的電話(huà)號(hào)碼,如手提、辦公室、家里、傳呼機(jī)號(hào)碼等。使用者還可以直接講出在電話(huà)簿上沒(méi)有登記的電話(huà)號(hào)碼,真正能實(shí)現(xiàn)全免提式的語(yǔ)音撥號(hào)功能。在該項(xiàng)目上,NUANCE公司提供了強(qiáng)勁而可靠的語(yǔ)音識(shí)別引擎,作為全個(gè)項(xiàng)目技術(shù)上的核心部份。

        Voice Command是一個(gè)覆蓋全美國(guó)的增值業(yè)務(wù),也是屬于Sprint PCS移動(dòng)電話(huà)服務(wù) 的一部份,當(dāng)置身于Sprint PCS移動(dòng)網(wǎng)絡(luò)覆蓋范圍內(nèi),你便可以享用該個(gè)人語(yǔ)音電 話(huà)簿服務(wù)。Sprint PCS為推廣Voice Command,有時(shí)還將該業(yè)務(wù)跟其它業(yè)務(wù)服務(wù)一 同打包推出。否則,你便要支付約5至10美元的月費(fèi),才可以享用該方便且好用的個(gè)人語(yǔ)音電話(huà)簿服務(wù)。

        該服務(wù)是以網(wǎng)絡(luò)為基礎(chǔ)的,它能正常運(yùn)作并兼容任何一種在Sprint PCS移動(dòng)網(wǎng)絡(luò)上 支持的電話(huà)種類(lèi)。使用者可以非常簡(jiǎn)單地按 " * OK " 或 " * talk " 鍵后,便會(huì)聽(tīng)見(jiàn) 一個(gè)特殊音號(hào)及一個(gè)語(yǔ)音服務(wù)的提示語(yǔ),這也表示你已經(jīng)接駁到Voice Command個(gè) 人語(yǔ)音電話(huà)簿服務(wù)。就是那幺簡(jiǎn)單!

        Voice Command的成功,在電訊業(yè)界上是一個(gè)非常重要的里程碑,它有著指導(dǎo)性的 意義。該服務(wù)是一個(gè)非常完整及靈活的系統(tǒng),也應(yīng)該是給予最終使用者的一個(gè)公平測(cè)試,讓他們可以真正看到靈活的語(yǔ)音撥號(hào)為他們帶來(lái)的價(jià)值。

        有著業(yè)務(wù)能即時(shí)覆蓋全國(guó)的優(yōu)點(diǎn),以及合理的服務(wù)價(jià)格,Voice Command業(yè)務(wù)贏得 普遍用戶(hù)的接受,也帶來(lái)其它眾多運(yùn)營(yíng)商對(duì)采用語(yǔ)音技術(shù)的廣泛認(rèn)可,當(dāng)然一定少不了Sprint PCS在移動(dòng)電話(huà)業(yè)務(wù)上的競(jìng)爭(zhēng)對(duì)手呢!

        Voice Command個(gè)人語(yǔ)音電話(huà)簿業(yè)務(wù)是其中一種運(yùn)營(yíng)商的戰(zhàn)術(shù)工具,用作建立用戶(hù)對(duì)運(yùn)營(yíng)商的忠誠(chéng)度。利用其業(yè)務(wù)本身具有個(gè)性化的特性,續(xù)步影響最終使用者的使用習(xí)慣,使得他們也投資在業(yè)務(wù)上 --- 即創(chuàng)制及持續(xù)維護(hù)自己的個(gè)人電話(huà)簿。這樣 ,便能達(dá)至運(yùn)營(yíng)商想要用戶(hù)維持選用其業(yè)務(wù)的最終目標(biāo)。還有,語(yǔ)音功能能夠?yàn)橛脩?hù)提供在各項(xiàng)業(yè)務(wù)服務(wù)上更方便、更好用的用戶(hù)界面,運(yùn)營(yíng)商便會(huì)有可能再在現(xiàn)有服務(wù)費(fèi)水平上增收額外的付加費(fèi)用。

    總結(jié)

        最后,我們NUANCE公司深信,隨著上半年各運(yùn)營(yíng)商在中、港、臺(tái)三地紛紛推出不同形式的語(yǔ)音業(yè)務(wù)或服務(wù),差不多可以肯定今年到明年,將會(huì)是語(yǔ)音業(yè)界豐收的階段。我們還認(rèn)為在中國(guó)的市場(chǎng),將會(huì)比歐美市場(chǎng)更為旺盛。在個(gè)人手機(jī)用戶(hù)數(shù)量上,中國(guó)已經(jīng)超越美國(guó),成為最多用戶(hù)數(shù)量的國(guó)家,再加上中國(guó)加入世界貿(mào)易組織(WTO)等多種有利條件,都是給我們帶來(lái)在業(yè)界市場(chǎng)上非常正面的信息,令人鼓舞。一個(gè)真正達(dá)至全面語(yǔ)音技術(shù)應(yīng)用的世界,還需要各方面共同合作及參予,當(dāng)然包括有各固網(wǎng)及移動(dòng)網(wǎng)絡(luò)運(yùn)營(yíng)商,以及NUANCE公司的合作伙伴,使我們的夢(mèng)想成為明日真實(shí)的世界。謝謝各位!

    NUANCE公司供稿 CTI論壇編輯



    相關(guān)鏈接:
    Nuance發(fā)布Vocalizer 5.0文本語(yǔ)音轉(zhuǎn)換方案 2009-09-04
    化繁為簡(jiǎn),讓手機(jī)“一切行動(dòng)聽(tīng)指揮” 2009-08-13
    Nuance語(yǔ)音識(shí)別技術(shù)助力醫(yī)學(xué)中心節(jié)省開(kāi)支 2009-08-12
    Nuance攜手IBM提供先進(jìn)的語(yǔ)音識(shí)別解決方案 2009-08-05
    Nuance語(yǔ)音識(shí)別技術(shù)將進(jìn)軍中國(guó) 2009-06-17

    分類(lèi)信息:  電信_(tái)與_語(yǔ)音識(shí)別ASR  電信_(tái)與_統(tǒng)一通信     文摘   行業(yè)_電信_(tái)案例   技術(shù)_語(yǔ)音識(shí)別_文摘   技術(shù)_統(tǒng)一通信_(tái)文摘