首頁>>廠商>>語音識別與合成>>言豐科技

應(yīng)用無限的語音技術(shù)

雨夏 2001/11/15

盡管有了遙控家電,有了電腦,有了手機,有了各種各樣的鍵盤設(shè)備,但人們還是希望能夠通過自然語言來控制我們所使用的各種工具。對于語音識別技術(shù)的研究和語音應(yīng)用的探索,始終是人們不會放棄的命題。

從語音識別技術(shù)的角度來看,目前有三個研究發(fā)展方向,即面向電腦、電話和手機的應(yīng)用。電腦的語音錄入應(yīng)用是指電腦能夠把人所說的話記錄下來,解決文字輸入的問題;電話的語音識別應(yīng)用是借助通信平臺,實現(xiàn)語音技術(shù)的更廣泛應(yīng)用;手機的語音識別應(yīng)用是嵌入式的語音識別技術(shù),實現(xiàn)手機、尋呼機在移動通信中的語音識別應(yīng)用。

據(jù)專業(yè)人士預(yù)測,5-10年以后,上述3個方向?qū)l(fā)生相互融合。而言豐科技所研究的領(lǐng)域?qū)W⒃陔娫挼恼Z音識別和語音合成技術(shù)上,致力通過基于通信平臺的實現(xiàn)語音識別技術(shù)更為廣泛的、更有實際價值的商業(yè)應(yīng)用,為客戶提供語音及電話功能。而開發(fā)商可在其提供的軟件平臺基礎(chǔ)上快速簡捷進行應(yīng)用方案的開發(fā),增設(shè)一系列具競爭力的高度個性化服務(wù),使客戶通過電話輕松獲取各種資訊。這項技術(shù)對中國市場尤為重要,全國電話數(shù)量與上網(wǎng)電腦的比例將近40:1,同時呈現(xiàn)出移動電話的增長率高于固定電話的發(fā)展趨勢。

在討論了語音識別技術(shù)很多年之后,為什么這個話題在最近又大幅度升溫了呢?言豐科技總裁粱康忠博士說:“技術(shù)的發(fā)展在一定階段時打破了應(yīng)用的瓶頸,從而帶來了應(yīng)用的進步。因為語音識別是一項難度很大的技術(shù),里面的算法非常復(fù)雜,對CPU的要求也非常高,過去應(yīng)用的條件不具備。而近幾年CPU發(fā)展很快,而語音識別中的算法也日益精湛,兩者有機地集成在一起后,應(yīng)用的條件就日趨成熟!

語音識別技術(shù)進入商用時代

語音技術(shù)開辟了一個巨大的應(yīng)用市場,目前的語音技術(shù)應(yīng)用的程度如何呢?

1.技術(shù)成熟

國內(nèi)在漢語的語音技術(shù)方面,語音合成技術(shù)比較成熟,已經(jīng)達到了商用的標準;在語音識別方面,亦已經(jīng)有一些產(chǎn)品成功投入商用,如言豐科技的e-t@lk產(chǎn)品。

2.促進網(wǎng)絡(luò)的融合

語音技術(shù)的發(fā)展,帶動了網(wǎng)絡(luò)的融合過程。目前,世界上的兩大通信網(wǎng)絡(luò)是電信網(wǎng)和計算機網(wǎng),電信網(wǎng)絡(luò)是以語音信號為處理對象,計算機網(wǎng)絡(luò)則是以數(shù)據(jù)對象為其處理內(nèi)容。而語音技術(shù)為兩個網(wǎng)絡(luò)的結(jié)合,奠定了技術(shù)基礎(chǔ)。

3.語音接入通過電信網(wǎng)

目前,人們進行信息交流的主要方式還是通過固網(wǎng)、移動網(wǎng)、PSTN、IP電話等電信網(wǎng)。用戶可以通過撥打一個電話號碼,接入到信息訪問中心。

基于電話的語音應(yīng)用

隨著中國電信事業(yè)的迅速發(fā)展和電話普及率的不斷提高,電話自動聲訊服務(wù)已走進百姓的日常生活,人們越來越多地感受到了這些服務(wù)系統(tǒng)帶來的便捷。根據(jù)系統(tǒng)提供的選擇目錄并在電話上按鍵選擇,人們便可獲得所要查詢的信息。但很多時候,電話按鍵的局限性所帶來的不便也令人倍感無奈。

言豐科技的交談式語音理解系統(tǒng)充分發(fā)揮計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的優(yōu)勢,采用先進的人機語言對話方式,擺脫電話按鍵的束縛,人們只須要像平常一樣對著電話簡單地說出所需服務(wù)項目,無須按鍵即可輕松獲取自動聲訊服務(wù)系統(tǒng)提供的所需信息。雖然每個人的語音特征都有所不同,并會隨著時間而改變,但言豐科技語音理解系統(tǒng)均可加以識別,即使是從來未對該系統(tǒng)說過話的人。

言豐科技的交談式語音理解系統(tǒng)亦可識別自然的查詢對話。例如在一個天氣查詢系統(tǒng)上,使用者可用不同的查詢方法來發(fā)問:(我想知道北京的天氣),(北京今天的天氣怎樣?),(請告訴我北京的天氣。┑龋到y(tǒng)都可以識別和處理這些不同的問話查詢。此外,該系統(tǒng)還能辨認連續(xù)自然的說話,用戶不需要生硬地在字句間作出刻意的停頓。

言豐交談式語音理解系統(tǒng)另一特點是可以識別多種語言,甚至混合的語言。例如香港市面上不少的電話聲訊系統(tǒng)均需要用戶輸入香港身份證號碼[例:A123456(7)]以求確認其身份,但礙于音頻按鈕的局限,用戶只可輸入數(shù)目字。如采用了言豐科技語音識別系統(tǒng),用戶就能直接說出整個身份證號碼,包括最前的英文字"A"及用中文讀出所有數(shù)目字和"括弧"。另外,香港某些股票名稱如“ASM太平洋”夾雜了中英文,言豐的系統(tǒng)也能加以準確識別!

鑒于電話機本身質(zhì)量及線路/網(wǎng)絡(luò)狀況的不同,一般通過電話網(wǎng)傳輸?shù)恼Z音都有不同程度的變化。言豐科技的交談式語音理解系統(tǒng)可以容納很大差異的語音質(zhì)素,從而保證在不同的環(huán)境下,系統(tǒng)都能識別用戶的說話,無需使用特殊的電話裝置。

語音技術(shù)商機無限

因為語音識別聲訊系統(tǒng)是讓用戶通過電話獲取資訊,因此任何需要借助電話提供資訊的行業(yè),均可受惠于使用此產(chǎn)品,特別是一些通過對話提供快速資訊的行業(yè),如銀行、旅游、公共服務(wù)機構(gòu)及電信等。言豐科技電話語音理解聲訊系統(tǒng)的應(yīng)用范圍十分廣泛,包括自動化客戶服務(wù)、金融交易、電話銀行服務(wù)、股票報價、航班查詢等。 這些應(yīng)用不僅可減輕人力資源的壓力及節(jié)省成本,更可創(chuàng)造出獨特的互動客戶服務(wù)、大幅提高公司的市場競爭力。以下是一些具代表性的例子。

1.銀行及金融業(yè)

銀行及金融業(yè)樞紐必須掌握最新資訊。無論用戶希望查詢戶口結(jié)余,或是進行戶口轉(zhuǎn)帳,應(yīng)用了語音理解技術(shù)的聲訊查詢系統(tǒng)可不分晝夜地為您提供二十四小時的電話銀行理財服務(wù)。而證券業(yè)方面,股票經(jīng)紀每天要應(yīng)付數(shù)以千計的電話查詢。若是采用言豐科技電話語音識別聲訊系統(tǒng)的話,用戶想查詢行情便可以直接講出股票名稱或代碼,而系統(tǒng)確認用戶的要求后,會自動讀出最新的股票價,相比起要每次輸入不同的股票代碼的煩瑣,大大方便了用戶,同時改善了服務(wù)的形象。

2、電信和尋呼

現(xiàn)今電信業(yè)競爭激烈,用戶對于在任何時間獲取各地資訊之需求,愈來愈迫切,因此,電信業(yè)需要具備高質(zhì)量的客戶服務(wù)。言豐科技電話語音識別聲訊系統(tǒng),不單能識別多種語音,更令顧客電話服務(wù)目錄自動化,創(chuàng)出獨特的互動客戶服務(wù),減輕人力資源的壓力,節(jié)省資本,從而產(chǎn)生另一項新收入。該技術(shù)在電信業(yè)務(wù)中將產(chǎn)生很多的應(yīng)用。例如在“114”電話黃頁中,目前還要有大量的人工服務(wù),而如果采用語音技術(shù),就可省卻人工服務(wù),讓計算機自動接聽用戶的需要,然后回放查詢的電話號碼。尋呼目前還是通過尋呼小姐記下用戶要尋呼的目標號碼,然后將內(nèi)容輸入到尋呼系統(tǒng)進行發(fā)射。采用語音技術(shù)后,可以讓計算機自動地進行整個操作過程。

3、公用事業(yè)

公共事業(yè)是另一個需要處理大量來電的典型例子。他們需要提供各式各樣的顧客服務(wù)和處理大量的日常來電。這些來電查詢可以通過電話語音識別聲訊系統(tǒng)的幫助得以解決,言豐科技電話語音理解聲訊系統(tǒng)可以按照來電者指示操作帳戶。針對亞洲市場特點如香港、新加坡、北京等國際性大都會,言豐科技開發(fā)的是一個能夠明白多國語言的語音理解聲訊系統(tǒng),以更為有效提升各行各業(yè)的客戶服務(wù)水準!

4、旅游及運輸業(yè)

旅游及運輸業(yè)是另一個可受惠于采用言豐科技電話語音識別聲訊系統(tǒng)的行業(yè)。這行業(yè)每天也要處理大量來電,如一位旅客希望知道最新的天氣情況,又或是一些商人查詢最新的船期情況,旅游及運輸公司便可利用言豐科技電話語音識別聲訊系統(tǒng)有效的應(yīng)付來電查詢。例如在航班查詢系統(tǒng)內(nèi),用戶只要說出國家或城市名稱就能得知有關(guān)的航班消息。

5.娛樂

言豐語音技術(shù)在娛樂方面,也可以激發(fā)出許多的新應(yīng)用。例如,在通過電話進行電視MTV點播時,可以避免重復(fù)地按電話上的按鍵,而是直接說出哪個歌手的哪首歌,電視臺就接受語音輸入,而播放相應(yīng)的曲目。

語音識別網(wǎng)絡(luò)系統(tǒng)的應(yīng)用方案

語音識別系統(tǒng)的應(yīng)用展望

現(xiàn)代科技的發(fā)展總是快過人類的預(yù)期。以爆炸速度發(fā)展起來的因特網(wǎng)(Internet)的普及迅速改變了人類的生活方式和生活質(zhì)量,引起世界各國的廣泛關(guān)注。信息交流的加快,導(dǎo)致企業(yè)競爭的加劇和服務(wù)意識增強。公共服務(wù)網(wǎng)絡(luò)系統(tǒng)是為廣大用戶服務(wù)而設(shè)計的計算機系統(tǒng),因此,如何讓用戶能夠以最簡單、最方便、最滿意的方式使用這些系統(tǒng)獲取信息,應(yīng)是系統(tǒng)方案設(shè)計者首要考慮的問題。從這個意義上講,計算機技術(shù)及其網(wǎng)絡(luò)系統(tǒng)的興起,將給公共語音識別系統(tǒng)的應(yīng)用帶來廣闊的發(fā)展空間和市場前景,以"說話"方式來操控計算機網(wǎng)絡(luò)系統(tǒng)將徹底改變?nèi)藗儙资晷纬傻?quot;按鍵"操控的傳統(tǒng)概念和習(xí)慣,使人重歸"自然",輕松自由。專家預(yù)言,未來的計算機服務(wù)網(wǎng)絡(luò)系統(tǒng)與用戶終端接口都少不了"電話公共語音識別功能",而電話就象計算機一樣是每個網(wǎng)絡(luò)系統(tǒng)必不可少的終端裝置。甚至可以說,是否具有電話-公共語音識別功能將是衡量一個網(wǎng)絡(luò)系統(tǒng)水準和完整性的重要標志之一!

由此可見,語音識別產(chǎn)品/系統(tǒng)將成為二十一世紀具有強有力市場競爭力的高技術(shù)產(chǎn)品。美國風(fēng)險投資家Ed. Paisley針對語音識別的市場前景說過這樣一段話:未來技術(shù)投資中的"大事"就是語音識別,或許它將能夠與狂熱的Internet投資相抗衡。作為贏家,語音識別將在新的市場中大出風(fēng)頭!

金言豐語音技術(shù)供稿 CTI論壇編輯



相關(guān)鏈接:
怡和、匯卓及言豐攜手為香港地鐵更新客戶服務(wù)熱線 2004-09-03
言豐與新太合作積極為中國電信開發(fā)168聲訊臺服務(wù) 2004-08-20
中國首都火車站選用言豐科技產(chǎn)品 2004-04-30
言豐科技支援新加坡政府的智能家居應(yīng)用項目 2003-01-29
語音互聯(lián)網(wǎng)產(chǎn)業(yè)的探討 2002-11-20