首頁>>廠商>>語音識別與合成>>言豐科技

語音門戶:讓網(wǎng)絡(luò)接入更便捷

言豐科技有限公司總裁 梁康忠博士 2001/05/11

  隨著我國通信事業(yè)的迅速發(fā)展,電話的普及率在大大提高。從這個意義上講,計算機技術(shù)及其網(wǎng)絡(luò)系統(tǒng)的發(fā)展,將給公共語音識別系統(tǒng)的應(yīng)用帶來廣闊的發(fā)展空間和市場前景。

語音門戶的發(fā)展背景

  在當(dāng)今飛速發(fā)展的信息社會,“移動”與“互聯(lián)”已經(jīng)成為不可阻擋的潮流,越來越多的人們要通過網(wǎng)絡(luò)來優(yōu)化自己的生活,如: 查詢股票信息、天氣預(yù)報、航班列車時刻、網(wǎng)上購物等。隨時隨地獲取信息并進(jìn)行基于電子商務(wù)平臺的交易,已越來越成為人們的迫切需要。Internet的蓬勃發(fā)展和迅速普及已逐漸使很多人把從網(wǎng)上獲取信息和通過網(wǎng)絡(luò)實現(xiàn)電子商務(wù),視作日常生活中的一部分。

  然而,人們通過計算機上網(wǎng)的同時,也越來感到這種方式受到時間、地點等諸多因素限制,很難做到信息的及時獲取,人們希望通過隨處可見的電話得到自己所需要的信息。目前,像160等傳統(tǒng)的聲訊服務(wù)臺,采用雇傭話務(wù)員提供信息服務(wù)的方式,不僅成本昂貴,而且由于工作繁重容易導(dǎo)致接聽人員服務(wù)水平下降。而通過如168等自動聲訊服務(wù)方式,雖然也可以獲取一些信息,但是由于電話機按鍵的限制,很多信息無法用按鍵輸入表示。因而許多具體的應(yīng)用不是難以實現(xiàn),就是在實現(xiàn)時由于多級菜單過于繁瑣使用戶感到不便; 另外,繁多的聲訊臺號碼也讓使用者在急需服務(wù)時,往往一時找不到所需的號碼。

  由于以上原因,人們越來越希望可以通過電話設(shè)備實現(xiàn)快速便捷的交流,即通過電話接入網(wǎng)絡(luò)并操縱遠(yuǎn)程的信息源,以得到信息或進(jìn)行電子化交易。交談式語言是人類最自然的交流方式,通過語音瀏覽和接入互聯(lián)網(wǎng),也一直是人類的追求目標(biāo)。目前,采用撥號接入網(wǎng)絡(luò)的程序通常需耗時數(shù)十秒,而通過語音接入所需的時間只有短短幾秒,因而通過語音界面,無疑將大大提高接入速度。另外,這種語音技術(shù)將令使用者無論在何時、身處何地,都可以利用手中的電話裝置(移動或固定均可),就能輕松接入網(wǎng)絡(luò),得到所需信息或購買商品及服務(wù)。更重要的是,這種方式將大大提高商業(yè)自動化程度,降低企業(yè)的運營成本,改善服務(wù)質(zhì)量,使商務(wù)活動更加便捷。語音門戶(Voice Portal)的出現(xiàn),正滿足了人們這些需要,為互聯(lián)網(wǎng)詮釋出全新的涵義。

  從技術(shù)的角度看,過去數(shù)十年,自動語音識別(ASR)技術(shù)、文本轉(zhuǎn)語音(TTS)技術(shù)已經(jīng)從實驗室中逐步走向成熟,其算法復(fù)雜性也以每兩年下降一半的速度遞減,從而使這些技術(shù)逐步在市場中得到廣泛應(yīng)用; 另一方面,電子計算機的運算能力每兩年可以翻一番,也為這些技術(shù)的商業(yè)應(yīng)用奠定了堅實的基礎(chǔ);再加上移動用戶終端的種類與功能也在以前所未有的速度增長。所有這些技術(shù)的發(fā)展都為基于語音的互聯(lián)網(wǎng)門戶—語音門戶的發(fā)展提供了可靠保證。

  言豐科技從事語音技術(shù)多年,在自動語音識別(ASR)、文本轉(zhuǎn)語音(TTS)等語音技術(shù)領(lǐng)域都擁有成熟可靠的產(chǎn)品,在此基礎(chǔ)上,融合了CTI技術(shù)、Web技術(shù)、電信技術(shù)、計算機及網(wǎng)絡(luò)等技術(shù),構(gòu)筑出了新一代的上網(wǎng)平臺——語音門戶。它代表了計算機語音與互聯(lián)網(wǎng)融合的新趨勢,將使更多的用戶能夠快速接入互聯(lián)網(wǎng),為企業(yè)帶來新的業(yè)務(wù)增長點。

系統(tǒng)平臺帶來的益處

從該系統(tǒng)面向的對象來看,無論對于企業(yè),還是個人,語音門戶都將帶來很大的益處。

  首先,它可為最終用戶帶來巨大的方便,用戶只要對著一部隨手可得的電話發(fā)話即可,不再受制于按鍵音頻,也不必因為不便攜帶電腦而“望信息興嘆”。這不僅使那些并不擅于使用計算機的人也能夠輕松地通過互聯(lián)網(wǎng)獲得服務(wù),同時也使那些手邊沒有計算機的人也能夠獲得必要的信息。目前,市場上推出的互聯(lián)網(wǎng)移動終端只注重將互聯(lián)網(wǎng)內(nèi)容移到終端上,卻沒有充分考慮這些系統(tǒng)的易用性,而語音門戶恰好彌補了這一不足,使任何人都能夠通過語音門戶暢游互聯(lián)網(wǎng)。

  另一方面,該平臺具有巨大的商業(yè)價值,企業(yè)本身會從該系統(tǒng)中受益。從系統(tǒng)平臺的角度看,它能夠替代話務(wù)員工作,可令企業(yè)將更多的人力與精力投放在對其核心增值服務(wù)的開拓上,并為其產(chǎn)品和服務(wù)在激烈的市場競爭中開辟出新的空間。比如,我們最常用的交互式語音應(yīng)答系統(tǒng)IVR,具有自動語音交互功能,可使企業(yè)在節(jié)省更多成本的同時,享受更自然、更舒適的交互界面。同時,實現(xiàn)語音交互功能的IVR應(yīng)用也比雙音多頻(DTMF)或按鈕應(yīng)用更方便,這也將為企業(yè)帶來更好的投資回報。

從應(yīng)用功能上來看,語音門戶為用戶帶來了方便的應(yīng)用:

  一方面,語音門戶讓用戶可隨時隨地輕松獲取各種信息。例如,用戶只需用普通電話機或移動電話撥打語音門戶網(wǎng)的特定號碼,就可在語音提示引導(dǎo)之下用自然語言和耳朵便捷地“瀏覽”天氣、新聞、體育等多方面的信息。在這個過程中,不必鍵入菜單選擇,僅需簡單的語音應(yīng)答即可完成操作。所以,無論是通過PC機、手機或者固定電話,也無論是在辦公室、家中,還是在路上、車上,用戶只要通過與語音門戶展開交互式對話,就可以像“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè),使“瀏覽”網(wǎng)絡(luò)的過程變得輕松無比!

  另一方面,語音門戶還可讓用戶隨時隨地進(jìn)行訂票、購物等電子化交易。人們采用語音門戶平臺獲得網(wǎng)上信息并開展交易活動的方式,與通過代理人建立連接相比,速度更快,并且還可享受到更廉價的服務(wù)。正如門戶網(wǎng)站把自身信息和其他信息整合起來一樣,語音門戶也把自身語音信息資源和其他資源綜合在了一起,在普通的電話網(wǎng)上以一個統(tǒng)一的號碼向用戶提供各種各樣的信息服務(wù)。其他的諸如虛擬個人助理、股票交易代理、企業(yè)內(nèi)自動值守、旅游訂票系統(tǒng)等,也可靈活地在該平臺上構(gòu)筑實現(xiàn)。

業(yè)務(wù)功能實現(xiàn)

  作為VoiceXML組織的重要成員,言豐推出了完全自主設(shè)計的語音門戶平臺。用戶通過這個平臺,可把有線電話網(wǎng)、無線通信網(wǎng)、尋呼網(wǎng)、Internet聯(lián)系為一個有機的整體,用戶通過電話不但可以查詢股票行情、天氣預(yù)報、航班動態(tài)、火車時刻表等信息,而且可點播自己定制的新聞、證券評論等; 同時也可以把它作為自己的統(tǒng)一消息平臺。更為重要的是,在該平臺上,用戶還可直接與計算機系統(tǒng)進(jìn)行互動操作,通過該平臺實現(xiàn)購買飛機票、股票等語音電子商務(wù)活動。歸納起來,該系統(tǒng)可分為信息查詢、信息點播、交易處理、統(tǒng)一消息等4個功能模塊。

信息查詢功能

  通過該功能模塊,用戶在全天24小時內(nèi)可隨時得到全方位的語音信息服務(wù),企業(yè)也可通過該平臺提高服務(wù)質(zhì)量,并在實現(xiàn)了呼叫自動化的基礎(chǔ)上節(jié)省企業(yè)運營成本。該模塊的主要功能包括:

  用戶對股票信息進(jìn)行查詢時,不但可查詢實時股票行情,而且對另開戶進(jìn)行股票交易的客戶和利用存折進(jìn)行股票交易的客戶,還提供資金查詢服務(wù);也可對客戶所擁有的證券情況或客戶的委托情況等進(jìn)行全方位的信息查詢服務(wù)。

信息點播功能

  信息點播可以使用戶訂購和點播自己想得到的內(nèi)容,如股票實時行情查詢、證券指數(shù)查詢、天氣查詢、出港航班查詢等信息,可實現(xiàn)股票點播、天氣預(yù)報、股票漲跌告警、體育(福利)彩票、航班信息、火車時刻、熱點新聞、電視節(jié)目、生活常識等實用信息的點播服務(wù)。

交易處理功能

  通過語音平臺,用戶可以實現(xiàn)電子化交易,即語音電子商務(wù)。該項業(yè)務(wù)可以針對某一行業(yè)進(jìn)行定制,也可以提供多種行業(yè)的綜合交易服務(wù)。

  用戶通過電話辦理某項交易時,由于交易不同,所涉及的用戶資料也不同,如用戶業(yè)務(wù)性能和功能變化、用戶產(chǎn)權(quán)變更等,所以必須先通過用戶賬號、密碼管理系統(tǒng)等手段確認(rèn)、證實,并制定相應(yīng)的管理制度,以進(jìn)行嚴(yán)格管理。

統(tǒng)一消息功能

  信息社會的快速發(fā)展使每天都有各種各樣的信息涌向我們每一個人,這些信息給我們帶來巨大的便利和經(jīng)濟效益,同時也使我們處于這樣一種窘境:我們擁有如此之多的通信聯(lián)系方式,如電話、手機、呼機等,而這些通信工具又互不相干,無法實現(xiàn)信息互通,以至于我們不得不逐項檢查這些信息源,去提取屬于我們的有用信息。而語音平臺中“統(tǒng)一消息”功能模塊可將這些功能集中在一起,用戶通過一個統(tǒng)一的號碼接入系統(tǒng),即可得到全部所需信息。

結(jié) 束 語

  語言,一直是并且仍將是人們進(jìn)行信息交流的最自然、最直接和最主要的方式。人們希望用語音和計算機直接進(jìn)行交流,讓計算機擁有能聽懂語言的“耳朵”,這就是人們對計算機自動語音識別的構(gòu)想。計算機智能語音識別的意義十分重大,它使人們可以方便地通過語音完成各種操作。目前,世界上一些服務(wù)行業(yè)的企業(yè),如銀行、股票公司、旅游服務(wù)公司、航空公司等,紛紛投資、合作開發(fā)或購買具有語音功能的服務(wù)系統(tǒng),以此降低其運營成本。如AT&T電話公司,通過自動語音交互應(yīng)答系統(tǒng),可以識別出用戶的付費方式。僅此一項,每年就為該公司節(jié)省下巨額成本?梢姡Z音識別系統(tǒng)應(yīng)用已給一些發(fā)達(dá)國家?guī)砹司薮蟮慕?jīng)濟效益; 同時,也說明了自動語音識別服務(wù)系統(tǒng)已經(jīng)形成了一定的市場規(guī)模,并將迅速成為具有市場競爭力的高技術(shù)含量的產(chǎn)品。

  電話語音智能識別系統(tǒng)利用現(xiàn)有發(fā)達(dá)的電話網(wǎng),使用戶能夠以最簡單、最方便、最滿意的方式獲取信息。以“說話”的方式來操縱計算機網(wǎng)絡(luò)系統(tǒng),將徹底改變?nèi)藗儙资晷纬傻陌存I操作的傳統(tǒng)概念和習(xí)慣,使人重歸自然,輕松自由。美國朗訊科技公司在推廣使用具有語音識別功能的電話自動服務(wù)系統(tǒng)時,做過一個統(tǒng)計: 在增加語音識別功能之前,大約有19%的打電話者聽到第一組提示時沒有任何反應(yīng); 增加該功能后,這個百分比降到了2%。此外,起初約有36%的打電話者仍堅持用按鍵方式,但在一星期后,完全使用語音識別功能的人數(shù)增加到46%。

計算機世界》2001/05/11



相關(guān)鏈接:
怡和、匯卓及言豐攜手為香港地鐵更新客戶服務(wù)熱線 2004-09-03
言豐與新太合作積極為中國電信開發(fā)168聲訊臺服務(wù) 2004-08-20
中國首都火車站選用言豐科技產(chǎn)品 2004-04-30
言豐科技支援新加坡政府的智能家居應(yīng)用項目 2003-01-29
語音互聯(lián)網(wǎng)產(chǎn)業(yè)的探討 2002-11-20