中文字幕专区高清在线观看,香蕉视频下载链接,国产成人涩涩涩视频在线观看

基于TMS320C6201的G.723.1多通道語(yǔ)音編解碼的實(shí)現(xiàn)

2008/06/03

　　當(dāng)前，Voice over IP(VoIP)技術(shù)正在不斷普及，通過(guò)Internet的語(yǔ)音通信量也日漸增加。目前VoIP中使用的低碼率語(yǔ)音壓縮標(biāo)準(zhǔn)主要有G.723.1和G.729兩種。隨著VoIP技術(shù)的不斷發(fā)展，要求產(chǎn)品的集成度與性能進(jìn)一步提高，利用新一代高性能DSP芯片，實(shí)現(xiàn)單片DSP處理多路語(yǔ)音信號(hào)，是今后的發(fā)展趨勢(shì)。本文根據(jù)C6201芯片的特點(diǎn)，作了大量針對(duì)G.723.1標(biāo)準(zhǔn)本身的優(yōu)化，降低了運(yùn)算量，滿足了多路信號(hào)的實(shí)時(shí)實(shí)現(xiàn)。

　　１ G.723.1標(biāo)準(zhǔn)介紹

　　G.723.1標(biāo)準(zhǔn)是ITU組織于1996年推出的一種低碼率編碼算法。主要用于對(duì)語(yǔ)音及其他多媒體聲音信號(hào)的壓縮，如可視電話系統(tǒng)、數(shù)字傳輸系統(tǒng)和高質(zhì)語(yǔ)音壓縮系統(tǒng)等。

　　G.723.1標(biāo)準(zhǔn)可在6.3kbps和5.3kbps兩種碼率下工作。其中，高碼率算法具有較高的重建語(yǔ)音質(zhì)量，而低碼率算法的計(jì)算復(fù)雜度則較低。與一般的低碼率語(yǔ)音編碼算法一樣，G.723.1標(biāo)準(zhǔn)采用線性預(yù)測(cè)的合成分析法（Analysis－by－Synthesis）。對(duì)激勵(lì)信號(hào)進(jìn)行量化時(shí)，高碼率算法采用多脈沖最大似然量化（ＭＰ－ＭＬＱ），而低碼率算法則采用算術(shù)碼本激勵(lì)線性預(yù)測(cè)（ACELP）。目前，G.723.1已經(jīng)能在多種DSP芯片上實(shí)現(xiàn)，如美國(guó)TI公司的TMS320C5x、TMS320C54x和朗訊科技公司的DSP16xx等。

　　G.723.1編碼器能對(duì)以8kHz采樣的話帶語(yǔ)音信號(hào)進(jìn)行壓縮，其結(jié)構(gòu)框圖見(jiàn)圖1（a）。從圖中可以看出，編碼器是基于線性預(yù)測(cè)合成分析法原理，其目的是最小化感知加權(quán)誤差信號(hào)。為了降低碼率，G.723.1采用了較長(zhǎng)的幀尺寸，每幀240個(gè)樣值，即30毫秒幀長(zhǎng)。每幀輸入信號(hào)首先通過(guò)一階高通濾波器濾除直流分量，然后將之分成四個(gè)60個(gè)樣值的子幀，每個(gè)子幀獨(dú)立進(jìn)行LPC分析。為了提高LPC系數(shù)的連續(xù)性，采用了長(zhǎng)度為180個(gè)樣值的重疊窗，即同時(shí)包含前后兩個(gè)子幀，這使算法引入60個(gè)樣值的超前時(shí)延，因此算法的總時(shí)延為37.5毫秒。LPC系數(shù)用線性譜頻率（LSF）表示，LSF參數(shù)采用預(yù)測(cè)分裂矢量量化，只對(duì)第四子幀進(jìn)行。為了提高量化感知質(zhì)量，高通濾波后的語(yǔ)音信號(hào)需通過(guò)共振峰感知加權(quán)濾波器和諧振峰噪聲整形濾波器以生成初始目標(biāo)信號(hào)。前者參數(shù)由各子幀的未量化LPC系數(shù)構(gòu)成，后者通過(guò)對(duì)每?jī)勺訋M(jìn)行開環(huán)基音周期估計(jì)得到，其中基音周期的范圍為18到142個(gè)樣值。lpc合成濾波器、共振峰感知加權(quán)濾波器和諧振峰噪聲整形濾波器用于系統(tǒng)零輸入響應(yīng)計(jì)算和最佳激勵(lì)估計(jì)。G.723.1編碼器還包括一個(gè)五階基音預(yù)測(cè)器，其參數(shù)根據(jù)開環(huán)基音估計(jì)值和脈沖響應(yīng)進(jìn)行閉環(huán)基音搜尋得到。在進(jìn)行最佳激勵(lì)估計(jì)時(shí)，需從初始目標(biāo)信號(hào)中減去系統(tǒng)零輸入響應(yīng)和基音預(yù)測(cè)器貢獻(xiàn)以得到最終目標(biāo)信號(hào)，然后針對(duì)高低碼率分別采用MP-MLQ和ACELP方法進(jìn)行量化。其中LSF參數(shù)、基音值和激勵(lì)參數(shù)需傳送給解碼器。

　　解碼器首先根據(jù)得到的LSF參數(shù)重建LPC合成濾波器，然后根據(jù)基音值和激勵(lì)參數(shù)得到自適應(yīng)碼本激勵(lì)信號(hào)和固定碼本激勵(lì)信號(hào)。為了提高重建語(yǔ)音的主觀質(zhì)量，解碼器還包括一個(gè)后濾波器，后濾波器由共振峰和基音后濾波器組成。激勵(lì)信號(hào)依次通過(guò)基音后濾波器、合成濾波器和共振峰后濾波器合成重建語(yǔ)音，其結(jié)構(gòu)框圖見(jiàn)圖1（b）。

３標(biāo)準(zhǔn)的實(shí)現(xiàn)

　　用C6201實(shí)現(xiàn)G.723.1標(biāo)準(zhǔn)的最大優(yōu)勢(shì)在于它極強(qiáng)的并行處理能力，用一塊DSP可以實(shí)現(xiàn)多路語(yǔ)音的壓縮，大大簡(jiǎn)化了硬件的設(shè)計(jì)。C6201是TI公司推出的第一種支持C編譯器的DSP芯片。通常，C編譯器能完成整個(gè)工作的70%，而30%的進(jìn)一步優(yōu)化必須通過(guò)手寫匯編來(lái)實(shí)現(xiàn)，所以對(duì)整個(gè)程序的優(yōu)化分為C語(yǔ)言級(jí)和匯編語(yǔ)言級(jí)兩部分。

　　３．１ C語(yǔ)言級(jí)的優(yōu)化

　�。常保� 循環(huán)展開(loop-unrolling)

　　使用具有并行能力的ＤＳＰ開發(fā)軟件時(shí)，一個(gè)重要的思想就是充分利用DSP的字長(zhǎng)和數(shù)目眾多的運(yùn)算單元，盡量把循環(huán)體展開。通過(guò)增加每次循環(huán)中執(zhí)行的指令數(shù)來(lái)減少總的循環(huán)次數(shù)，可使得在同樣的時(shí)鐘周期內(nèi)能運(yùn)行更多的指令，提高了循環(huán)的效率。

３．１．２提高寄存器的利用率

　　DSP芯片內(nèi)部的運(yùn)算單元運(yùn)行效率非常高，但如果寄存器和數(shù)據(jù)總線之間的數(shù)據(jù)交換頻繁，將使DSP的執(zhí)行效率大打折扣。因?yàn)镈SP在進(jìn)行內(nèi)存操作時(shí)，往往需要若干周期的延遲，如Load指令要有4個(gè)周期的延遲，STORE指令需要2個(gè)周期的延遲。為了減少耗時(shí)的內(nèi)存操作，可以在程序進(jìn)入循環(huán)體之前，將要頻繁使用的數(shù)據(jù)預(yù)先放入寄存器，然后反復(fù)調(diào)用，實(shí)踐證明這種方法可以提高一部分效率。

　　３．１．３使用內(nèi)在函數(shù)（Intrinsic）

　　內(nèi)在函數(shù)是在某些C6201DSP的匯編指令前加上“_”構(gòu)成它可以方便地實(shí)現(xiàn)某些需若干C語(yǔ)句才能實(shí)現(xiàn)的功能。它是一種非常簡(jiǎn)便高效的優(yōu)化方法，它的調(diào)用格式和普通Ｃ函數(shù)一樣，但在編譯時(shí)編譯器會(huì)自動(dòng)將Intrinsic用對(duì)應(yīng)的匯編指令替代。C6201指令集中絕大多數(shù)的運(yùn)算邏輯指令都可以這樣使用，比如飽和絕對(duì)值、飽和加、飽和減、飽和乘、兩個(gè)字中的對(duì)應(yīng)半字同時(shí)加或同時(shí)減、兩個(gè)字中的對(duì)應(yīng)半字同時(shí)乘或交叉乘、歸一化及位操作等。經(jīng)過(guò)此步優(yōu)化后，大部分循環(huán)體都可以生成較為有效的流水內(nèi)核（piplinedkernel）。用Intrinsic替代G.723.1原先的C代碼，運(yùn)算量下降為原來(lái)的1/10。

　　３．１．４對(duì)算法的冗余部分合理精簡(jiǎn)

　　經(jīng)過(guò)檢查，發(fā)現(xiàn)ITU-TG.723.1的C代碼存在冗余部分。象6.3K碼率的MP-MLQ搜索模塊中，只需要用到偶數(shù)位置的脈沖響應(yīng)的自相關(guān)，所以對(duì)奇數(shù)位置的脈沖響應(yīng)自相關(guān)計(jì)算可以省略。

　　另外，在G.723.1標(biāo)準(zhǔn)中存在大量的10階FIR和10階IIR濾波器運(yùn)算，如編碼部分的感知加權(quán)、零輸入響應(yīng)、解碼部分綜合濾波器和后濾波等，F(xiàn)IR和IIR的通用形式可以表示為：

　　每次循環(huán)，F(xiàn)IR濾波器內(nèi)存要用新的輸入值更新，IIR濾波器內(nèi)存要用新的輸出值更新，使用按標(biāo)準(zhǔn)提供的算法，要專門用一個(gè)10階循環(huán)更新內(nèi)存。如果用一個(gè)10單位大小的循環(huán)緩存區(qū)，每次用新值覆蓋最老的樣值，動(dòng)態(tài)調(diào)整循環(huán)緩存區(qū)的頭指針，可以節(jié)省原先用于內(nèi)存更新的cycle。

　�。常� 匯編級(jí)優(yōu)化

　　由于C編譯器只能完成70%的工作且對(duì)于復(fù)雜的循環(huán)，C編譯器無(wú)法生成高效率的代碼，所以對(duì)運(yùn)算量大的模塊只能用手寫匯編。

　　３．２．１字長(zhǎng)優(yōu)化

　　C6201的字長(zhǎng)為32位，它支持按字節(jié)、半字、字存取。對(duì)于16位的數(shù)組，當(dāng)它在內(nèi)存中連續(xù)排列時(shí)，用32位讀寫指令LDW或STW替代16位讀寫指令LDＨ或STH，循環(huán)次數(shù)可減少一半。另外，C6201的匯編指令支持兩個(gè)32位寄存器的高16位和低16位之間互乘，結(jié)果分別放到不同的寄存器中，互不影響。具體指令為SMPY(LxL)、SMPYH(HxH)、SMPYHL(HxL)和SMPYLH(LxH)。通過(guò)字長(zhǎng)優(yōu)化，可以大大提高程序的運(yùn)行效率。必須注意的是，在使用字長(zhǎng)優(yōu)化時(shí)，數(shù)組在內(nèi)存中的位置必須對(duì)齊32位邊界。

　�。常玻� 對(duì)外循環(huán)的優(yōu)化

　　C6201的C編譯器對(duì)多重循環(huán)的最內(nèi)層一般能較好地優(yōu)化到一句到兩句，但對(duì)外循環(huán)的優(yōu)化效率則差很多。手寫匯編時(shí)，可以先將內(nèi)循環(huán)展開，再把外循環(huán)的指令并入其中，可以減少所耗費(fèi)的cycle數(shù)。

　　C6201的循環(huán)一般分前導(dǎo)(Rorlog)、內(nèi)核(Kernel)及排空(Epilog)三部分。代碼的并行程度從Rrolog開始不斷提高，Kernel內(nèi)的并行程度最高，Epilog與Prolog相反，并行性逐漸降低。在多重循環(huán)中，如果盡量把內(nèi)循環(huán)前導(dǎo)部分的指令與填入排空部分未用的單元，一起執(zhí)行，可以在執(zhí)行本次循環(huán)的排空語(yǔ)句的同時(shí)執(zhí)行下次循環(huán)的前導(dǎo)語(yǔ)句。這樣可不多花cycle而提高整個(gè)循環(huán)的效率。

　　４實(shí)現(xiàn)結(jié)果

　　經(jīng)過(guò)C語(yǔ)言級(jí)和匯編級(jí)的多種優(yōu)化，最后實(shí)現(xiàn)了一路G.723.1的編解碼需要花費(fèi)10.6MCPS，整個(gè)代碼的程序空間為208K byte（程序中包括了部分c6201的庫(kù)函數(shù)），數(shù)據(jù)空間為8K byte，碼本大小20k byte，多通道的上下文數(shù)據(jù)為1.48K byte。200MHz的C6201每秒可以實(shí)時(shí)編解碼16路語(yǔ)音信號(hào)。所有代碼全部通過(guò)了ITU-T測(cè)試矢量的測(cè)試。表1是各主要模塊的運(yùn)算量。

表1 G.723.1各主要模塊運(yùn)算量

　　本文提出的利用C6201 DSP進(jìn)行ITU-TG.723.1全雙工實(shí)時(shí)多通道語(yǔ)音編解碼的實(shí)現(xiàn)。該實(shí)現(xiàn)可以在IP電話、視頻會(huì)議中得到廣泛應(yīng)用。

嵌入式開發(fā)網(wǎng)

相關(guān)鏈接:

混合型VoIP系統(tǒng)更實(shí)用 2008-06-03

統(tǒng)一通信的新技術(shù)困擾 2008-06-03

揭秘融合大勢(shì)下諸多不和諧 2008-06-03

SaaS VoIP呼叫中心有哪些優(yōu)勢(shì)？ 2008-05-29

和黃Skype手機(jī)勝算幾何 2008-05-28

分類信息: