首頁>>廠商>>語音識別與合成>>捷通華聲

捷通華聲“聲動點(diǎn)播”,讓語音業(yè)務(wù)“增值”
--淺談?wù)Z音識別的行業(yè)應(yīng)用

2005/09/07

  讓機(jī)器聽懂人類的語言,是人們長期以來夢寐以求的事情。語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高級技術(shù)。隨著這種技術(shù)的日趨成熟,讓語音帶來商機(jī)已不再是若干年前人們眼中的天方夜談。

  尤其是在電信領(lǐng)域,轟轟烈烈的產(chǎn)業(yè)大規(guī);A(chǔ)設(shè)施投資已成為過去,增值業(yè)務(wù)正在迅猛發(fā)展;ヂ(lián)網(wǎng)的普及程度目前還遠(yuǎn)未達(dá)到人們的需求,而相對普及率很高的電話、手機(jī)成為人們彼此溝通、獲取信息的最佳選擇,電話語音增值服務(wù)的興起已是大勢所趨。傳統(tǒng)的聲訊服務(wù)中,用戶需要根據(jù)提示音、用按鍵來選擇所需要的信息或服務(wù),或是通過人工坐席來實(shí)現(xiàn)。而基于語音識別技術(shù)的自動語音應(yīng)答系統(tǒng),用戶只需在撥入電話后,直接說出自己的需求即可,極大滿足了現(xiàn)代社會人們追求信息獲取的便捷、通暢。

  語音技術(shù)包括人機(jī)交互的兩個方面,語音識別:讓系統(tǒng)自動識別說話人的語言或者命令;語音合成:讓系統(tǒng)根據(jù)預(yù)設(shè)條件或者呼叫者的請求,自動將文本、數(shù)據(jù)庫信息轉(zhuǎn)換成語音播放出來。 而這一"說"、一"聽"的互動,正是人們?nèi)粘K钍煜、最?xí)慣的語音交互方式,從根本上彌補(bǔ)了互聯(lián)網(wǎng)、傳統(tǒng)電話按鍵的"無聲" 時代給人們帶來的不便。

  語音識別技術(shù)可以解放用戶的雙手,免去按鍵的不便和繁瑣,只要對著話筒說出需求,就可輕松完成。語音識別技術(shù)應(yīng)用不僅僅解放了人的雙手,更突破了電話數(shù)字鍵盤的局限。例如在點(diǎn)歌節(jié)目中,用電話鍵盤上的0-9十個數(shù)字及*號和#號共12個鍵來指代成千上萬首歌曲是不可能實(shí)現(xiàn)的。很大程度上限制了可供用戶選擇的歌手及歌曲的數(shù)量。而且用戶需要記憶眾多歌曲編碼,通過按鍵的方式在電話中輸入,無法快速檢索到需要的歌曲。極大影響了用戶參與的積極性。而引入語音識別技術(shù)以后,用戶說出歌曲名稱或者歌手姓名就可直接調(diào)出所需的歌曲,很好地解決了以上提到的問題。

  語音識別技術(shù)不僅僅可以解決原有業(yè)務(wù)中的局限與弊端,更能拓展全新的業(yè)務(wù)領(lǐng)域。例如近幾年十分流行的語音電話本業(yè)務(wù)。用戶利用網(wǎng)頁等方式添加的聯(lián)系人姓名、昵稱、電話號碼、 email地址等都可以利用語音合成轉(zhuǎn)換成語音供電話查詢。基于語音識別技術(shù),用戶撥打電話的時候只需要說出聯(lián)系人的姓名就可以接通。 現(xiàn)代人越來越依賴于手機(jī),大量的聯(lián)系人信息存在手機(jī)中,而當(dāng)手機(jī)沒電或者丟失時,這些信息就很難獲取。而語音電話本真正實(shí)現(xiàn)了人們擁有一個"永不丟失、迅速接通的個人語音電話本"的需求。用戶的聯(lián)系人信息全部保存在服務(wù)器上,用戶也就不會輕易更換運(yùn)營商了。運(yùn)營商不僅開拓了新的收益來源,更大大提高了其用戶的忠誠度。

  一個成功的語音應(yīng)用首先是基于詳細(xì)準(zhǔn)確的用戶需求調(diào)查。只有詳細(xì)了解客戶需求,才能根據(jù)需要選用不同類型的產(chǎn)品。捷通華聲針對火爆的彩鈴市場情形,結(jié)合運(yùn)營商現(xiàn)有平臺的特性,度身定制了聲動語音門戶--"聲動點(diǎn)播"平臺。該平臺集成了目前最為先進(jìn)的語音技術(shù),包括語音識別、語音合成、電信級的智能語音交互集成技術(shù)等。用戶只需撥入系統(tǒng)后,通過簡單的語音命令、導(dǎo)航操作,即可實(shí)現(xiàn)鈴音的選擇、試聽、下載、分配、贈送、查詢等,整個過程簡潔流暢。真正實(shí)現(xiàn)了人機(jī)交流的流暢自然,給人們帶來更加輕松便捷的應(yīng)用,為廣大用戶提供時尚體驗(yàn)的渠道及個性張揚(yáng)的平臺,同時為電信增值業(yè)務(wù)不斷賦予全新的活力。

  在語音識別領(lǐng)域,美國Scansoft公司 (Nasdaq: SSFT)是世界上最優(yōu)秀的語音技術(shù)供應(yīng)商之一。是專業(yè)從事商業(yè)應(yīng)用軟件研究開發(fā)的全球知名國際企業(yè)。其語音識別引擎,在識別率、識別速度、系統(tǒng)穩(wěn)定性等方面都處于行業(yè)領(lǐng)先的地位。Scansoft公司的語音產(chǎn)品在通信、遠(yuǎn)程信息處理、移動終端等諸多領(lǐng)域有著廣泛的應(yīng)用,市場遍布全球并占有了國際語音技術(shù)領(lǐng)域最大的市場份額。

  捷通華聲作為業(yè)界知名的語音技術(shù)產(chǎn)品與服務(wù)提供商,與Scansoft公司強(qiáng)強(qiáng)聯(lián)手,將捷通華聲中文語音合成技術(shù)與Scansoft公司最新語音識別技術(shù)OSR全面整合,形成完整的語音技術(shù)解決方案以利于國內(nèi)、國際語音技術(shù)市場的廣泛應(yīng)用,使產(chǎn)品更加貼近用戶需求,更好的滿足市場需要。

  OSR( Open Speech Recognizer)是一種基于開放標(biāo)準(zhǔn)、可擴(kuò)展、高性能和高識別率的語音識別引擎,提供大詞匯量、非特定人、連續(xù)的語音識別功能,尤其是在各種無限環(huán)境之中對于噪音的處理功能強(qiáng)大。OSR產(chǎn)品可廣泛應(yīng)用在呼叫中心、自動總機(jī)、語音電話本、旅行預(yù)定、信息檢索、語音門戶和客戶自助服務(wù)等系統(tǒng)中。

  雙方都堅(jiān)信: 語音技術(shù)是下一代智能人機(jī)接口的重要組成部分。面對日愈開放的市場,語音技術(shù)的應(yīng)用擁有著廣闊的發(fā)展空間,雙方將通過密切的合作堅(jiān)持不懈的努力共同追求語音技術(shù)的不斷完善,為全世界提供自然、方便、理想的人機(jī)交互手段。

  讓機(jī)器聽懂人類的聲音已不再是夢,捷通華聲攜手Scansoft公司依托國際領(lǐng)先的語音技術(shù),為實(shí)現(xiàn)更多的人類夢想而不懈努力。

捷通華聲公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無怯步 2008-04-16
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28

相關(guān)頻道:           文摘   技術(shù)_語音識別_文摘