首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

分布式視頻會議系統(tǒng)的關(guān)鍵技術(shù)及實現(xiàn)

2005/11/23

  引言
  
  在目前已成為計算機領(lǐng)域熱點的群組協(xié)作計算工具中,視頻會議系統(tǒng)是其中的一個重要組成部分。電路交換網(wǎng)絡(luò)中的視頻會議系統(tǒng)已有較成熟的模型,如ITU的H.320標準等,但分組交換網(wǎng)(包括Ethernet、Internet等)的使用正日益普及,新的解決方案必須著重考慮如何利用這種網(wǎng)絡(luò)來實現(xiàn)視訊系統(tǒng)。
  
  本文提出的方案并不針對某種具體網(wǎng)絡(luò),而是根據(jù)Internet上多點視頻會議系統(tǒng)的需要設(shè)計的。它充分利用了分組交換網(wǎng)多播功能和高帶寬特點,是基于RTP協(xié)議的分布式多點會議系統(tǒng),端主機是支持IP多播的Solaris 2.x系統(tǒng),具有以下特點:
  1. 每個節(jié)點的數(shù)據(jù)通過多播到達其他節(jié)點。

  2. 音頻和視頻的合成由端主機完成。

  3. 不使用參考時鐘實現(xiàn)發(fā)送/接收編解碼器的良好同步,對分組抖動和丟失有較好控制。

  4. 動態(tài)流控機制允許視頻壓縮器根據(jù)網(wǎng)絡(luò)狀態(tài)調(diào)整發(fā)送率。

  5. 采用一種適合IP網(wǎng)絡(luò)并能穿越防火墻的目錄服務(wù)體系。
  分布式視頻會議系統(tǒng)的關(guān)鍵技術(shù)
  會議系統(tǒng)的控制和數(shù)據(jù)傳送
  這是集中式方案中MCU的主要功能,在分布式系統(tǒng)中,MCU
  
  的功能可由網(wǎng)絡(luò)和/或端節(jié)點來實現(xiàn)。在我們的方案中,數(shù)據(jù)傳送主要利用了分布式網(wǎng)絡(luò)的多播功能,不少控制功能都由端主機和網(wǎng)絡(luò)共同實現(xiàn)。
  
  帶寬的有效使用和服務(wù)質(zhì)量保證
  分組交換網(wǎng)的復用機制可有效利用帶寬,但也可能導致報文抖
  
  動甚至丟失。Internet大部分還未實現(xiàn)服務(wù)質(zhì)量(QoS)保證,傳統(tǒng)應(yīng)用中通常由較高層TCP/IP協(xié)議來保證可靠傳輸。TCP用重傳機制實現(xiàn)可靠傳輸,其內(nèi)部流控機制根據(jù)確認包動態(tài)調(diào)整發(fā)送率。對于實時會議,重傳導致的延遲是無法忍受的,因此傳輸層協(xié)議使用不具有可靠傳輸和內(nèi)部流控制的UDP,而端到端同步和流控的任務(wù)則轉(zhuǎn)嫁到視頻會議系統(tǒng)上。
  
  目錄服務(wù)功能

  Internet不像電路交換網(wǎng),它沒有統(tǒng)一的尋址機制,另外還存在
  
  防火墻和地址不公開的問題,因此目錄服務(wù)是分布式會議系統(tǒng)中要解決的重點問題。
  
  分布式多點視頻會議系統(tǒng)的具體實現(xiàn)方案

  整體結(jié)構(gòu)

該系統(tǒng)的主要硬件如下:
  1. 音頻/視頻捕捉/回放卡。聲音、圖像和數(shù)據(jù)作為不同的流進行傳送,接收者可選擇從某個源只接收聲音,這對于沒有圖像處理功能的端節(jié)點特別有用,用靜默檢測避免不發(fā)言時發(fā)送音頻流。

  2. Codec和DSP(數(shù)字信號處理器)卡。DSP根據(jù)端用戶的選擇合成視頻和音頻源,它還具有屏蔽時鐘不同步、聲音/圖像不同步和分組丟失等功能?ㄉ线有一個Ethernet網(wǎng)卡,會議系統(tǒng)可直接連到LAN上,無需CPU的參與。音頻/視頻捕捉/回放卡和Codec/DSP卡之間有直接接口,可繞過系統(tǒng)總線,節(jié)省CPU時間。
  傳輸層協(xié)議的選擇

  由于UDP不提供端到端可靠傳輸,出現(xiàn)了基于UDP、專為實時
  
  通信提供傳輸層服務(wù)的RTP協(xié)議。盡管RTP本身不實現(xiàn)服務(wù)質(zhì)量保證,但它提供的多路復用、順序號、時標、監(jiān)控及對IP多播的靈活接口對我們設(shè)計的多播、同步、會話數(shù)據(jù)加密、動態(tài)流控、目錄服務(wù)、安全穿越防火墻等方法非常重要。RTP是一個開放協(xié)議,為上層應(yīng)用提供了充分的靈活性。但RTP的組成部分之一RTCP(實時傳輸控制協(xié)議)提供的松散管理和監(jiān)控功能還不能滿足我們所需的控制和管理功能(如動態(tài)獲取和分發(fā)多播地址、分發(fā)會話密鑰等),所以我們采用H.323的集中管理模型。
  
  網(wǎng)絡(luò)的多播
  
  多播在現(xiàn)有網(wǎng)絡(luò)中實現(xiàn)的并不多,在這種情形下,我們認為實
  
現(xiàn)多播的途徑可有以下幾中:
  1. 使用實現(xiàn)了DVMRP的交換式以太網(wǎng)Hub,通過Hub之間的Tunnel功能在Internet上構(gòu)造多播網(wǎng)絡(luò)。

  2. 在Internet上以傳統(tǒng)方式進行分組的復制和轉(zhuǎn)發(fā),端系統(tǒng)通過為每個目的節(jié)點復制和轉(zhuǎn)發(fā)分組的方式來模擬多播。

  3. 當數(shù)據(jù)從實現(xiàn)多播的局域網(wǎng)向未實現(xiàn)的局域網(wǎng)發(fā)送時,使用RTP的Translator模擬多播功能。我們使用的是第三種,為了實現(xiàn)更方便的地址分配和安全保密功能,還需具有動態(tài)、分布式和安全特性的目錄服務(wù)的配合。
  壓縮數(shù)據(jù)流的合成

  在分布式系統(tǒng)中,網(wǎng)絡(luò)的多播功能使每個端節(jié)點可同時接收多個源的圖像和聲音,而合成由端系統(tǒng)實現(xiàn)。為了降低開銷,我們的合成是對壓縮視頻流進行的。壓縮視頻流的合成算法也是當前的研究熱點,我們的算法利用了以下事實;幾乎所有的標準視頻壓縮數(shù)據(jù)都包含一系列獨立的由預(yù)定義分隔符分隔的編碼組,通過檢查分隔符可將壓縮數(shù)據(jù)流分成像素區(qū)域。將各段壓縮數(shù)據(jù)與像素區(qū)域?qū)?yīng)起來后,就可根據(jù)用戶設(shè)置來重新組裝這些數(shù)據(jù)。
  
  會話的保密

  接收方發(fā)起的多播使得發(fā)送方無法控制接收數(shù)據(jù)的用戶,局域網(wǎng)的廣播性質(zhì)使得局域網(wǎng)上任何主機都有可能監(jiān)聽會話,因此有必要對會話數(shù)據(jù)加密。可以用會話初始協(xié)議分發(fā)會話密鑰,也可用RTP會話配置文件保存會話密鑰(這種方法安全性低)。為了防止已知明文攻擊,每個消息中應(yīng)加入一次性且不可預(yù)測的信息。RTP報頭的時標字段為我們提供了這個機制,而加密RTCP報文之前應(yīng)在要加密的報文前添加一個隨機數(shù)。
  
  時鐘同步和聲音/視頻同步

  點到點連接中接收方根據(jù)數(shù)據(jù)到達速率實現(xiàn)與服務(wù)方的同步。
  
  分布式多點會議中有多個發(fā)送/接收對需同步,這種方案就不適合了。我們設(shè)計了一種簡單有效的方法解決時鐘不同步和同一源的聲音/圖像不同步問題。該方法使用了RTP提供的時標,可簡單概括為:靜音抑制音頻數(shù)據(jù)包的發(fā)送。聲音在接收端以接收方的音頻時鐘回放,音頻時鐘的不同步在靜默期間被抵消。音頻/視頻的同步是在每個音頻突發(fā)的開始時刻,通過丟棄一些延遲的視頻幀或者重用一些視頻幀實現(xiàn)的。此機制不需回放時鐘與捕捉時鐘的同步,它能達到預(yù)期性能是基于以下事實:
  1. 突發(fā)平均持續(xù)時間相對靜默持續(xù)時間較短;

  2. 捕捉端和回放端時鐘的不同步較小。這兩點使音頻/視頻的同步在較短的突發(fā)持續(xù)期間內(nèi)不可能漂移很多。我們對不同源數(shù)據(jù)流之間的順序關(guān)系沒有采取任何控制。隨著RMP(可靠多點發(fā)送協(xié)議)等協(xié)議在群組通信中的使用,我們將對這種順序進行控制。
  IP網(wǎng)目錄服務(wù)

  目錄服務(wù)在集中和分布式會議中都很重要。電路交換網(wǎng)中節(jié)點
  
  由固定號碼標識,分組交換網(wǎng)中節(jié)點由IP地址來標識。異質(zhì)網(wǎng)絡(luò)中,ATM節(jié)點由E.164標識,POTS和ISDN節(jié)點由電話號碼標識,Internet
  
  節(jié)點由IP地址標識,如果目錄服務(wù)能將會議參加者的名字轉(zhuǎn)換成其物理地址,將帶來很大方便。在移動通信中,會議參加者可能從不同地方接入Internet,使用動態(tài)地址,目錄服務(wù)更顯得必要。如果防火墻內(nèi)的用戶不想暴露自己的IP地址,目錄服務(wù)的功能將更復雜。
  
  Internet域名服務(wù)系統(tǒng)(DNS)是一種分布式目錄服務(wù)解決方案,但普通的DNS系統(tǒng)不支持動態(tài)分配的IP地址。動態(tài)IP地址查詢方案要求有一個實時登記機制獲取用戶登錄時動態(tài)分配的IP地址。目前已有的實時登記協(xié)議有SDP、LDAP、安全動態(tài)更新的DNS等(分布式)。Internet數(shù)據(jù)庫提供商也為各種應(yīng)用提供了專用實時登記協(xié)議(集中式)。集中式方案易實現(xiàn),但擴展性差,且要求所會議成員向同一服務(wù)提供商登記也不大可能。分布方式基于有DNS系統(tǒng),實踐證明它運行穩(wěn)定、擴展性良好。安全動態(tài)更新的DNS就是一個理想選擇。
  
  目前人們提出的目錄服務(wù)都未考慮穿越防火墻的問題。穿越防火墻最常用的方法是使用代理服務(wù)器。通用代理服務(wù)器也能進行IP地址轉(zhuǎn)換,且有一整套強大的安全功能,但它們的通用性也帶來了以下問題:
  1. 同時有許多應(yīng)用使用可能造成延遲,無法保證實時性;

  2. 為黑客提供了可突破的漏洞;

  3. 無法提供不同子網(wǎng)間域名查詢服務(wù);

  4. 在IP地址轉(zhuǎn)換級連的情況下會產(chǎn)生無法預(yù)料的情況。我們使用的專用代理能克服以上缺點,可在RTP的Mixer或Translator上實現(xiàn)
  5. 。
  假設(shè)A和B分別位于兩個不同的防火墻之內(nèi),我們可在A和B所在子網(wǎng)的防火墻上各設(shè)一個代理PA和PB,在它們共同連接的Internet有一個公共目錄服務(wù)提供商。假設(shè)A是呼叫方,B是被呼叫方。下面是穿越防火墻通信的過程:
  結(jié)束語

  Internet 的發(fā)展促使了新的分布式多點視頻會議解決方案的出現(xiàn),分布式解決方案與電路交換網(wǎng)絡(luò)中的集中式方案有很大區(qū)別。作為群組計算的一個重要應(yīng)用,分布式多點視頻會議系統(tǒng)會得到新的群組通信技術(shù)的進一步支持,如:更理想的多播路由算法和協(xié)議;能適應(yīng)復雜網(wǎng)絡(luò)環(huán)境的資源預(yù)留和信息過濾技術(shù);可靠有序的通信保障;針對會議系統(tǒng)應(yīng)用的支持。然而,如何最有效地使用這些支持來適應(yīng)視頻會議中復雜、多樣的需求將繼續(xù)是我們的研究主題。

中寬網(wǎng)



相關(guān)鏈接:
視頻光端機選購指南 2005-11-22
分析:寶利通收購鼎視通 強強聯(lián)手的互補并購 2005-11-21
“隨時隨地”的視頻需求 2005-11-21
視頻應(yīng)用的六大趨勢 2005-11-17
“五駕馬車”拉動視頻應(yīng)用快速前進 2005-11-17

相關(guān)頻道:           文摘   技術(shù)_視像通訊_文摘