首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

音頻、視頻常用的幾種壓縮技術(shù)標(biāo)準(zhǔn)

2008/02/20

MPEG-4視頻編碼技術(shù)介紹

  MPEG是“Moving Picture Experts Group”的簡稱,在它之前的標(biāo)準(zhǔn)叫做JPEG,即“Joint Photographic Experts Group”。當(dāng)人們用到常見的“.jpg”格式時,實際上正在使用JPEG的標(biāo)準(zhǔn)。JPEG規(guī)范了現(xiàn)代視頻壓縮的基礎(chǔ),而MPEG把JPEG標(biāo)準(zhǔn)擴(kuò)展到了運動圖象。 MPEG-4視頻編碼標(biāo)準(zhǔn)支持MPEG-1、MPEG-2中的大多數(shù)功能,它包含了H.263的核心設(shè)計,并增加了優(yōu)先特性和各種各樣創(chuàng)造性的新特性。它提供不同的視頻標(biāo)準(zhǔn)源格式、碼率、幀頻下矩形圖像的有效編碼,同時也支持基于內(nèi)容的圖像編碼。采納了基于對象(Object-Based)的編碼、基于模型(Model-based)的編碼等第二代編碼技術(shù)是MPEG-4標(biāo)準(zhǔn)的主要特征。

MPEG4與MPEG1、MPEG2的比較


  從上表可以看出,MPEG1和MPEG2主要應(yīng)用于固定媒體,比如 VCD 和 DVD ,而對于網(wǎng)絡(luò)傳輸,MPEG4具有無可比擬的優(yōu)勢。

H.263/H.263+/H.264視頻編碼技術(shù)介紹

H.263視頻編碼標(biāo)準(zhǔn)


  H.263 是最早用于低碼率視頻編碼的ITU-T標(biāo)準(zhǔn),隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。H.263是 ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)。它是在H.261基礎(chǔ)上發(fā)展起來的,其標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、 CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運動補(bǔ)償,并增加了4種有效的壓縮編碼模式。

H.263+視頻壓縮標(biāo)準(zhǔn)

  ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標(biāo)準(zhǔn)的版本2,非正式地命名為H.263+標(biāo)準(zhǔn)。它在保證原H.263標(biāo)準(zhǔn)核心句法和語義不變的基礎(chǔ)上,增加了若干選項以提高壓縮效率或改善某方面的功能。原H.263標(biāo)準(zhǔn)限制了其應(yīng)用的圖像輸入格式,僅允許5種視頻源格式。H.263+標(biāo)準(zhǔn)允許更大范圍的圖像輸入格式,自定義圖像的尺寸,從而拓寬了標(biāo)準(zhǔn)使用的范圍,使之可以處理基于視窗的計算機(jī)圖像、更高幀頻的圖像序列及寬屏圖像。為提高壓縮效率, H.263+采用先進(jìn)的幀內(nèi)編碼模式;增強(qiáng)的PB-幀模式改進(jìn)了H.263的不足,增強(qiáng)了幀間預(yù)測的效果;去塊效應(yīng)濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀質(zhì)量。為適應(yīng)網(wǎng)絡(luò)傳輸,H.263+增加了時間分級、信噪比和空間分級,對在噪聲信道和存在大量包丟失的網(wǎng)絡(luò)中傳送視頻信號很有意義;另外,片結(jié)構(gòu)模式、參考幀選擇模式增強(qiáng)了視頻傳輸?shù)目拐`碼能力。

H.264視頻壓縮標(biāo)準(zhǔn)

  H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。對信道時延的適應(yīng)性較強(qiáng),既可工作于低時延模式以滿足實時業(yè)務(wù),如會議電視等;又可工作于無時延限制的場合,如視頻存儲等。

  提高網(wǎng)絡(luò)適應(yīng)性,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,加強(qiáng)對誤碼和丟包的處理,提高解碼器的差錯恢復(fù)能力。

  在編/解碼器中采用復(fù)雜度可分級設(shè)計,在圖像質(zhì)量和編碼處理之間可分級,以適應(yīng)不同復(fù)雜度的應(yīng)用。

  相對于先期的視頻壓縮標(biāo)準(zhǔn),H.264引入了很多先進(jìn)的技術(shù),包括4×4整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測、1/4象素精度的運動估計、多參考幀與多種大小塊的幀間預(yù)測技術(shù)等。新技術(shù)帶來了較高的壓縮比,同時大大提高了算法的復(fù)雜度。

G.7xx系列典型語音壓縮標(biāo)準(zhǔn)介紹

  G.7xx 是一組 ITU-T 標(biāo)準(zhǔn),用于視頻壓縮和解壓過程。它主要用于電話方面。在電話學(xué)中,有兩個主要的算法,分別定義在 mu-law 算法(美國使用)和 a-law 算法(歐洲及世界其他國家使用),兩者都是對數(shù)關(guān)系,但對于計算機(jī)的處理來說,后者的設(shè)計更為簡單。

  國際電信聯(lián)盟G系列典型語音壓縮標(biāo)準(zhǔn)的參數(shù)比較:

  在國際標(biāo)準(zhǔn)中,統(tǒng)一使用 MOS(Mean Opinion Score)方法評價語音壓縮后的質(zhì)量。在MOS方法中,電話語音質(zhì)量的標(biāo)準(zhǔn)定為4分。也就是說,如果一種算法將語音壓縮后,MOS 值能達(dá)到4分,即說明其語音質(zhì)量和電話質(zhì)量等同,用戶無法分辨出其中的區(qū)別。

Global IP Sound(簡稱GIPS)

  Global IP Sound(簡稱GIPS),是瑞典一家全球頂級的專業(yè)從事語音編解碼引擎的技術(shù)公司。是一家位于瑞典斯德戈爾摩的高技術(shù)上市公司,成立于1999年,目前只有25位員工,但卻擁有世界上最頂尖的語音處理和IP電話技術(shù)專家:其公司CTO,Roar Hagen博士,1989年即進(jìn)入語音處理行業(yè)從事開發(fā)工作,在世界知名的AT&T貝爾實驗室、愛立信研究院工作。他本人發(fā)明了超過10項技術(shù)專利。

  Jan Linden博士,在語音處理和通訊領(lǐng)域從業(yè)12年。在加入Global IP Sound之前,Jan Linden博士在加州大學(xué)和SingnalCom公司供職。Patrik Srqvist,自1995年開始從事語音處理和VoIP研究開發(fā)工作,之前在愛立信研究院工作。

  就是這樣一家規(guī)模小同時卻擁有來自愛立信、 AT&T等電信行業(yè)巨頭的技術(shù)專家的公司,卻在VoIP引擎市場上取得了令人矚目的成就。GIPS SoundWare能為端對端 IP 通信提供較 PSTN 質(zhì)量更佳的語音體驗及保真度,完全不會受數(shù)據(jù)包丟失的影響。

投影時代



相關(guān)鏈接:
我國手機(jī)電視標(biāo)準(zhǔn)亟需敲定 2007-10-09
《商業(yè)周刊》:移動電視標(biāo)準(zhǔn)競爭愈演愈烈 2007-08-02
國際電信聯(lián)盟五大標(biāo)準(zhǔn)組織各有分工 2007-07-30
In-Stat:手機(jī)電視標(biāo)準(zhǔn)有可能融合 2007-07-24
手機(jī)電視困惑標(biāo)準(zhǔn)之爭 2007-06-13

分類信息:     標(biāo)準(zhǔn)匯編_文摘