首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

多媒體會(huì)議中的H.264編碼

南京郵電大學(xué) 馬國強(qiáng) 畢厚杰 2006/09/22

  H.264是新一代視頻壓縮編碼標(biāo)準(zhǔn),由兩大國際標(biāo)準(zhǔn)化組織ITU-T和ISO/IEC聯(lián)合開發(fā)。H.264和以前的標(biāo)準(zhǔn)一樣,也是采用基于塊的混合編碼模式,但是它在以往標(biāo)準(zhǔn)的基礎(chǔ)上對(duì)編碼算法進(jìn)行了改進(jìn),使得H.264算法具有很高的編碼效率。在同等的圖像質(zhì)量條件下,H.264的數(shù)據(jù)壓縮性能比當(dāng)前DVD系統(tǒng)中使用的MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因?yàn)槿绱耍?jīng)過H.264壓縮的視頻數(shù)據(jù),在網(wǎng)絡(luò)傳輸過程中所需要的帶寬更少,也更加經(jīng)濟(jì),所以更適合視頻會(huì)議業(yè)務(wù)。

  編碼器架構(gòu)與算法模塊

  隨著壓縮性能的提高,H.264的計(jì)算復(fù)雜度變得極高,H.264編碼的計(jì)算復(fù)雜度大約相當(dāng)于H.263(H.264的同系列標(biāo)準(zhǔn))的3~5倍,解碼復(fù)雜度大約相當(dāng)于H.263的2倍。為此,一款設(shè)計(jì)優(yōu)良的H.264編碼器必須充分考慮編碼速度與率失真性能之間的平衡。一般而言,H.264編碼器架構(gòu)主要包括以下各種算法。
  這是視頻壓縮編碼領(lǐng)域的核心技術(shù)之一。運(yùn)動(dòng)搜索技術(shù)的基本原理是搜索視頻序列中的相鄰圖像,找出運(yùn)動(dòng)信息和運(yùn)動(dòng)矢量,用表征物體運(yùn)動(dòng)的數(shù)據(jù)代替相應(yīng)圖像的原始信息,從而極大地消除時(shí)間冗余,達(dá)到數(shù)據(jù)壓縮的目的。
  在視頻流中,每幀圖像的編碼方式既可以是I幀(幀內(nèi)預(yù)測幀),也可以是P幀(幀間預(yù)測幀)。I幀的編碼效率沒有P幀高,但I(xiàn)幀是視頻碼流中的重要組成單位,因?yàn)镮幀提供重同步的能力。在傳輸中如果某幀發(fā)生丟包,則使用該幀預(yù)測的后續(xù)P幀將不能正確解碼,但由于I幀是自包含的,沒有引用任何以往的圖像,所以碼流在這里獲得重新同步,將錯(cuò)誤限制在一定范圍內(nèi)。
  在視頻編碼中會(huì)有許多編碼模式和參數(shù)的決策問題,率失真優(yōu)化算法對(duì)每個(gè)侯選的編碼模式或參數(shù)進(jìn)行評(píng)估,然后按照一定的法則挑選出最優(yōu)模式。
  監(jiān)測信道狀況,對(duì)碼率的分配作出決策。這個(gè)算法模塊需要和率失真優(yōu)化結(jié)合起來,形成編碼器的決策層。
  存儲(chǔ)器的邏輯和物理管理,并負(fù)責(zé)對(duì)參考幀隊(duì)列管理。在對(duì)P幀編碼時(shí),需要參考以往已編碼或解碼的圖像,進(jìn)行運(yùn)動(dòng)搜索,所以在編碼和解碼的同時(shí)必須建立參考幀隊(duì)列,存儲(chǔ)參考幀數(shù)據(jù)。
  對(duì)視頻序列壓縮的各種方法都圍繞三個(gè)方面:消除時(shí)間冗余、消除空間冗余、消除統(tǒng)計(jì)冗余。幀間和幀內(nèi)預(yù)測分別針對(duì)時(shí)間冗余和空間冗余,而消除統(tǒng)計(jì)冗余的方法就稱作熵編碼。

  H.264編碼器的工作流程

  編碼程序在設(shè)定編碼參數(shù)后,首先從輸入圖像序列中讀出一幀圖像數(shù)據(jù)作為當(dāng)前編碼圖像,并根據(jù)圖像特征分析編碼類型。每一幀圖像數(shù)據(jù)由若干個(gè)片數(shù)據(jù)組成,每一個(gè)片數(shù)據(jù)獨(dú)立編碼為一個(gè)NAL。當(dāng)寫好NAL的起始信息和片頭數(shù)據(jù)后,進(jìn)入圖像宏塊層編碼。

  進(jìn)入宏塊數(shù)據(jù)編碼子程序后,首先根據(jù)宏塊所處的幀類型,進(jìn)入相應(yīng)的宏塊編碼模式選擇算法模塊。選擇宏塊的編碼模式后,根據(jù)編碼模式進(jìn)入相應(yīng)的宏塊編碼模塊。幀內(nèi)編碼的宏塊的預(yù)測值是來自在同一圖像中的相鄰宏塊的像素值;幀間編碼的宏塊的預(yù)測值是來自于運(yùn)動(dòng)矢量所指向的參考圖像中相應(yīng)區(qū)域的像素值。用圖像的原始值減去預(yù)測值得到殘差數(shù)據(jù),對(duì)殘差數(shù)據(jù)變換、量化、熵編碼,進(jìn)一步消除其冗余信息,得到視頻編碼后的碼流。

  當(dāng)宏塊的編碼模式是幀內(nèi)亮度16×16或者幀內(nèi)色度8×8時(shí),整數(shù)變換后的直流分量要提出來經(jīng)過第二次變換。編碼后的碼流進(jìn)行反變換,重建宏塊數(shù)據(jù),為后續(xù)宏塊預(yù)測做準(zhǔn)備。當(dāng)一幀圖像重建好之后,繼續(xù)對(duì)該重建圖像進(jìn)行塊濾波,消除量化造成圖像的塊效應(yīng),隨后將可用于后續(xù)圖像編碼參考的圖像數(shù)據(jù)存入?yún)⒖紙D像隊(duì)列,更新參考圖像隊(duì)列。

計(jì)算機(jī)世界網(wǎng)(www.ccw.com.cn)



相關(guān)鏈接:
視頻會(huì)議系統(tǒng)的建設(shè)要注重合適的前期規(guī)劃 2006-09-22
視頻會(huì)議系統(tǒng)變局 2006-09-22
高清視頻會(huì)議系統(tǒng)——超越標(biāo)清 2006-09-22
看不清的高清 2006-09-22
視頻會(huì)議系統(tǒng)已成為美國主要教學(xué)工具之一 2006-09-19

相關(guān)頻道:           文摘   技術(shù)_視像通訊_文摘