Dialogic公司

訊飛與Dialogic合作打造“能聽會說”的3G視

2009-11-03 15:46:00   作者:   來源:CTI論壇編輯   評論:0 點擊:


  案例概述

  面臨挑戰(zhàn)

  在3G時代,業(yè)務應用的創(chuàng)新已經成為各大運營商提升盈利能力的重要手段,為了支持多樣化業(yè)務、多種終端以及設備間的交互,需要3G業(yè)務應用系統(tǒng)提供更人性化的交流模式,為用戶提供個性化的新體驗。

  解決方案

  科大訊飛基于多年來在全球語音技術方面的強大優(yōu)勢與Dialogic合作打造了“能聽會說”的3G視頻系統(tǒng),創(chuàng)造了全新的“人機交互”的交流模式,為3G應用的普及和發(fā)展增添了一股強勁的動力。

  實施效果

  目前科大訊飛“能聽會說”的3G視頻系統(tǒng)解決方案已經全面進入市場,并以聲動彩鈴、音樂搜索、語音搜索等靈活多樣的產品形式獲得了市場的認可。根據(jù)初步統(tǒng)計,科大訊飛的聲動彩鈴產品已在三大運營商全面應用?拼笥嶏w全球領先的語音技術已經讓3G視頻應用進入了新的時代。

  案例正文

  面臨挑戰(zhàn)

  隨著中國三大通信運營商重組的完成和3G牌照發(fā)放的結束,中國通信產業(yè)已經進入了3G時代。中國聯(lián)通、  中國移動、中國電信三大電信運營商在迎接發(fā)展機遇的同時,也面臨著業(yè)務應用創(chuàng)新的巨大挑戰(zhàn)。在3G時代,業(yè)務應用的創(chuàng)新已經成為各大運營商提升盈利能力的重要手段,為了支持多樣化業(yè)務、多種終端以及設備間的交互,需要3G業(yè)務應用系統(tǒng)提供更人性化的交流模式,為用戶提供個性化的新體驗。在這方面,安徽科大訊飛信息科技股份有限公司(以下簡稱“科大訊飛”)基于全球領先的智能語音技術與Dialogic公司(以下簡稱“Dialogic”)合作打造的“能說話且能聽懂話”的3G視頻應用系統(tǒng)解決方案,為3G應用的普及和發(fā)展增添了一股強勁的動力。

  成立于1999年的科大訊飛公司是國內最大的智能語音技術提供商,公司主要從事智能語音及語言技術研究、軟件及相關產品開發(fā)、語音信息服務等業(yè)務。公司擁有自主創(chuàng)新的智能語音核心技術,該技術實現(xiàn)了人機語音交互,使人與機器之間的溝通變得像人與人之間的溝通一樣順暢。具體來說,科大訊飛的智能語音技術的核心包括語音合成和語音識別兩項世界頂級技術。語音合成技術是讓機器能說話,語音識別技術則是讓機器能聽懂人說話。此外,智能語音技術還包括語音編碼、音色轉換、口語評測、語音消噪和增強等技術。利用這些技術,未來3G視頻應用將通過“語音”來完成指令輸入、信息查詢、身份識別、信息傳遞等功能。

  智能語音技術在3G應用中將發(fā)揮越來越重要的作用?拼笥嶏w副總裁江濤先生說:“語音是人們交流和獲取信息最自然、便捷的手段,利用智能語音技術可有效解決傳統(tǒng)電信增值業(yè)務中輸入不便、動態(tài)海量信息難以預錄音等問題,應用前景極為廣闊。”

  對于QoS(Quality of Service,服務質量),系統(tǒng)網關的交換能力和處理能力是關鍵?拼笥嶏w高級研發(fā)經理黃勇先生說,“我們系統(tǒng)的服務質量要求達到電信級水平,因此我們要求合作伙伴提供的語音板卡等設備必須高度穩(wěn)定,以避免在處理大量語音或其它媒體數(shù)據(jù)的時候,造成系統(tǒng)不穩(wěn)、處理中斷、響應緩慢等問題。另外,我們希望設備廠商能提供高效的開發(fā)環(huán)境,并能夠在應用系統(tǒng)開發(fā)過程中提供快速、專業(yè)的技術支持服務。”

  解決方案

  科大訊飛基于全球領先的智能語音技術并與Dialogic和合作,采用了其CG及TX系列產品打造了“能聽會說”的3G視頻系統(tǒng)。該系統(tǒng)可以提供許多3G業(yè)務應用,例如:3G視頻IVVR(Interactive Voice and Video Response,交互式語音及視頻應答)、移動電視、視頻點播、網絡KTV、語音查詢、語音短信等。該系統(tǒng)在結構方面主要包括兩大部分:第一部分是媒體網關,第二部分是后臺服務。

  媒體網關由兩類服務器組成:一類服務器選用Dialogic CG語音媒體卡,負責語音媒體信號的接入、處理、轉換等工作;另一類服務器選用Dialogic TX 4000信令卡,負責實現(xiàn)通信信道的建立、維護和釋放等工作。在基礎軟件方面,Dialogic 公司提供了功能豐富、高效靈活的 Natural Access 和 Video Access軟件系統(tǒng),作為3G視頻應用系統(tǒng)的開發(fā)環(huán)境。此開發(fā)環(huán)境提供了大量函數(shù),可以讓科大訊飛的技術開發(fā)團隊開發(fā)出各種創(chuàng)新型的3G應用。

  后臺服務由三類服務器組成,包括媒體服務器、應用服務器以及數(shù)據(jù)庫服務器。媒體服務器存放錄制好的視頻音頻節(jié)目供用戶點播。此外媒體服務器還提供實時流媒體服務(Real Time Streaming Service),具體服務內容根據(jù)用戶請求自動生成,如實時話單查詢,查詢結果通過RTSP 協(xié)議(Real Time Streaming Protocol)發(fā)送到遠端用戶的3G手機上。應用服務器用來執(zhí)行具體的業(yè)務服務,應用系統(tǒng)中的流程規(guī)劃、邏輯控制、業(yè)務管理均由應用服務器負責。數(shù)據(jù)庫服務器用于基礎數(shù)據(jù)的管理和應用執(zhí)行中產生數(shù)據(jù)的存儲。

  科大訊飛高級研發(fā)經理黃勇先生介紹說:“Dialogic 公司先后為我們提供了數(shù)萬端口的Dialogic CG6565等型號的多媒體板卡,Video Access軟件, 以及TX4000系列信令板卡,未來部署端口數(shù)量還會不斷攀升。Dialogic CG系列板卡提供16路或更多路T1/E1中繼接口,并擁有高密度DSP處理資源,內置IP功能和高速PowerPC處理器。Dialogic公司的TX4000系列產品為各種SS7(Signaling System 7,7號信令系統(tǒng))應用系統(tǒng)提供了功能強大而靈活的支持,提供的全面靈活的 SS7 信令堆棧 (MTP、ISUP、TUP、SCCP和TCAP)可以支持多達 32 路 SS7 信道。該平臺處理容量大,占用主機處理資源少,可以讓主機把更多的資源分配給其它應用。在實際的應用過程中,Dialogic CG系列和TX4000系列板卡均表現(xiàn)出了穩(wěn)定、高效、功能強大等諸多優(yōu)點,我們對其實際表現(xiàn)十分滿意。”

\

圖:科大訊飛3G視頻系統(tǒng)拓撲圖


  實施效果

  目前,科大飛訊采用Dialogic CG及TX系列產品打造的“能聽會說”的3G視頻系統(tǒng)解決方案已經全面進入市場,并以聲動彩鈴、音樂搜索、語音搜索等靈活多樣的產品形式獲得了市場的認可。以聲動彩鈴為例,這一產品不僅提供了通過簡單的語音命令快速完成鈴音的檢索、下載、分配、贈送等業(yè)務操作的便捷手段,還提供了完善的運營分析管理功能,可以讓用戶獲得更為完美的使用體驗。根據(jù)初步統(tǒng)計,科大訊飛的聲動彩鈴產品已在三大運營商全面應用。

  科大訊飛副總裁江濤先生說:“隨著3G市場競爭的加劇,我們基于智能語音技術+ Dialogic產品打造的‘能聽會說’的3G視頻系統(tǒng)解決方案,可以幫助電信運營商在操作語音化、服務個性化、娛樂多樣化等方面實現(xiàn)創(chuàng)新和突破,進而幫助運營商提升在3G市場中的綜合競爭能力。”

  在發(fā)展前景廣闊的3G視頻應用領域,科大訊飛全球領先的語音技術已經讓人機交互成為現(xiàn)實,推動3G視頻應用進入了新的時代。其實在金融、教育等多個領域,科大訊飛在語音技術核心研究和產業(yè)化方面的突出成就已經引起了各個行業(yè)的廣泛關注,科大訊飛公司已經成為為“全球中文語音產業(yè)的領軍企業(yè)”。  

分享到: 收藏