首頁>>>技術(shù)>>>VoIP

P2P VoIP應(yīng)用的性能評測

楊永銘 王喆 2008/09/24

  摘要:基于IP技術(shù)的語音分組傳輸(VoIP)電話目前被廣泛使用,Skype與GTalk是VoIP應(yīng)用的兩個(gè)典型代表。在可控網(wǎng)絡(luò)環(huán)境下,通過調(diào)整信道容量、時(shí)延、丟包、抖動等網(wǎng)絡(luò)參數(shù),利用PESQ MOS方法評測了Skype與GTalk的語音質(zhì)量,并且討論了在可變網(wǎng)絡(luò)環(huán)境下的動態(tài)適應(yīng)性策略。

1、引言

  VoIP是將模擬語音信號通過壓縮編碼處理變成語音數(shù)據(jù)流,然后按TCP/IP標(biāo)準(zhǔn)打包,再通過IP網(wǎng)絡(luò)傳輸,在接收端通過解壓縮編碼還原成模擬語音信號,完成整個(gè)通話過程[1]。由于IP網(wǎng)絡(luò)無業(yè)務(wù)質(zhì)量保障,會帶來一定的語音包時(shí)延和丟失,影響語音質(zhì)量,語音質(zhì)量問題是影響VoIP發(fā)展的重要因素。

2、P2P VoIP的應(yīng)用

  Skype與GTalk使用的是UDP/TCP傳輸協(xié)議,使用相同的編解碼器。Skype與GTalk繼承了P2P網(wǎng)絡(luò)的一些特性,如各節(jié)點(diǎn)間合作且共享網(wǎng)絡(luò)資源。Skype采用全球搜索目錄(GI)技術(shù),GI是一種可擴(kuò)展網(wǎng)絡(luò)技術(shù),它使用多層的網(wǎng)絡(luò)結(jié)構(gòu),利用超節(jié)點(diǎn)來實(shí)現(xiàn)網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)可以獲取所有其他可利用節(jié)點(diǎn)的資源,并將這些節(jié)點(diǎn)資源動態(tài)組合,來參與流量分配、路徑選擇、處理需要較大帶寬的任務(wù)等,并保證最小的時(shí)延。GTalk采用IETF制定的XMPP協(xié)議,可提供與其他VoIP應(yīng)用的免費(fèi)連接,GTalk網(wǎng)絡(luò)可以與其他VoIP網(wǎng)絡(luò)協(xié)同工作。

  有關(guān)VoIP應(yīng)用的研究工作現(xiàn)在正在不斷取得進(jìn)展。參考文獻(xiàn)[2]中評估了在GPRS網(wǎng)絡(luò)中VoIP的性能及業(yè)務(wù)質(zhì)量。Furuya評測了VoIP的服務(wù)質(zhì)量與網(wǎng)絡(luò)參數(shù)(容量與時(shí)延)的關(guān)系[3]。Baset S A和Schulzrinne H是Skype最早的研究者并初步分析了Skype的一些相關(guān)的技術(shù)[4],后來Guha等通過具體的實(shí)驗(yàn)重點(diǎn)研究了Skype中的超節(jié)點(diǎn),為研究VoIP的流量模型奠定了基礎(chǔ)[5]。

3、評測方法

  本文的工作是分析和比較Skype與GTalk在網(wǎng)絡(luò)環(huán)境狀況發(fā)生變化時(shí),它們的語音質(zhì)量及其服務(wù)質(zhì)量,這里所說的服務(wù)質(zhì)量是指對于網(wǎng)絡(luò)狀況發(fā)生變化的適應(yīng)能力。本文通過兩種方法來進(jìn)行研究。一是通過分析網(wǎng)絡(luò)傳送數(shù)據(jù)包的有效負(fù)載,以及所使用的編解碼規(guī)則和相關(guān)的參數(shù)信息,基于這些信息可以推斷它們的語音質(zhì)量和服務(wù)質(zhì)量[3]。另一種方法是通過一個(gè)評測模型來評估音質(zhì)量的優(yōu)劣,如E-model,它可以客觀地評價(jià)語音質(zhì)量但是需要利用各種網(wǎng)絡(luò)參數(shù)來評定語音質(zhì)情況。需要注意的是Skype使用專有的協(xié)議,并且采用了加密機(jī)制,這就阻止了對網(wǎng)絡(luò)傳送的數(shù)據(jù)包的分析,也就不能準(zhǔn)確地分析出它的語音質(zhì)量和服務(wù)質(zhì)量;谝陨涎芯靠梢园裋oIP網(wǎng)絡(luò)看作是一個(gè)黑盒子,在兩端對網(wǎng)絡(luò)參數(shù)進(jìn)行測試,來評估Skype與GTalk語音質(zhì)量。

  3.1 實(shí)驗(yàn)環(huán)境

  本文所建立的實(shí)驗(yàn)系統(tǒng)如圖1所示。主機(jī)S與主機(jī)R分別是發(fā)送端與接收端,負(fù)責(zé)語音信號的發(fā)送與接收。音頻記錄軟件使用Audacity。NAT-R與NAT-S是兩個(gè)NAT-Boxes,主機(jī)S和R通過它們與外界網(wǎng)絡(luò)進(jìn)行連接。Network Emulator(網(wǎng)絡(luò)仿真器)使用的是NIST.Net,完成各種網(wǎng)絡(luò)情景的再現(xiàn),CD播放器重復(fù)地產(chǎn)生一個(gè)長達(dá)1 h的采樣音頻,這些音頻數(shù)據(jù)通過網(wǎng)絡(luò)仿真器傳到R。

圖1 實(shí)驗(yàn)系統(tǒng)框架

  3.2 網(wǎng)絡(luò)的度量衡量標(biāo)準(zhǔn)

  實(shí)驗(yàn)中需要評測的性能參數(shù)有:語音質(zhì)量和從S到R的數(shù)據(jù)傳輸率(它是Skype與GTalk適應(yīng)性能的直接表現(xiàn))。對于傳輸數(shù)據(jù)流的分析工具是tcpstat。

  語音質(zhì)量的測評方法有幾種:一種是MOS(平均主觀值法)[6],這是由ITU-T制定的一個(gè)較為主觀的評價(jià)方法,由直接參與到語音通信中的人來評定語音的質(zhì)量,語音質(zhì)量最終被評為1~5分,分?jǐn)?shù)越高語音質(zhì)量越好。與MOS相比,E-model[7]是一種較為客觀的評估語音質(zhì)量的方法,關(guān)注影響語音質(zhì)量的全面的網(wǎng)絡(luò)損傷因素(如時(shí)延、抖動、回音、編解碼等)。由于不能獲得有關(guān)Skype與GTalk編解碼器的信息,所以就無法采用此方法來評測語音質(zhì)量。實(shí)驗(yàn)中所采用的是PESQ(感知評估通話質(zhì)量測評)[8],此方法實(shí)際上是通過復(fù)雜信號處理,用PESQ算法對發(fā)送信號和接收信號進(jìn)行校準(zhǔn),然后評估這兩個(gè)信號間的差異,最終評測結(jié)果對應(yīng)于MOS。

  3.3 實(shí)驗(yàn)描述

  在一個(gè)可控的網(wǎng)絡(luò)狀態(tài)下,對Skype和GTalk進(jìn)行評測。本文建立了4個(gè)具體的實(shí)驗(yàn),在這些實(shí)驗(yàn)中以下幾個(gè)參數(shù)分別出現(xiàn):信道容量、時(shí)延、丟包率和抖動,這些參數(shù)值的選取是針對Skype與GTalk來具體確定[9]。
  
  實(shí)驗(yàn)過程中,網(wǎng)絡(luò)參數(shù)會被定義為幾個(gè)不同的值,在語音傳輸過程中,這些值是動態(tài)變化的,在變化的每個(gè)階段,發(fā)送端會發(fā)送1 h的語音信號,接收端收到的是60個(gè)1 min的語音信號。實(shí)驗(yàn)對Skype與GTalk是在相同狀況下重復(fù)進(jìn)行,Skype的版本為2.0.0.81,GTalk的版本為1.0.0.92。

4、性能評測

  4.1 信道容量影響

  在此實(shí)驗(yàn)中,設(shè)定時(shí)延25 ms且沒有明顯的丟包和抖動。要研究的是當(dāng)信道容量逐漸變化(50 kbit/s、40 kbit/s、30 kbit/s、20 kbit/s、15 kbit/s)時(shí),Skype與GTalk相應(yīng)的變化。通過觀察傳輸率(見圖2)和PESQ MOS(見圖3),發(fā)現(xiàn)在信道容量為50 kbit/s時(shí)GTalk利用了更多的帶寬,傳輸速率比Skype更高。當(dāng)信道容量變?yōu)?0 kbit/s時(shí),GTalk發(fā)生了很明顯的變化,傳輸速率降低到了35 kbit/s。這個(gè)變化使得其PESQ MOS分?jǐn)?shù)與Skype相比有所提高,而Skype的傳輸速率則接近信道容量。當(dāng)信道容量變?yōu)?0 kbit/s時(shí),兩者間差異不大。當(dāng)信道容量為20 kbit/s時(shí),Skype首次優(yōu)于Gtalk,當(dāng)信道容量為15 kbit/s時(shí),Skype的PESQ MOS分?jǐn)?shù)比GTalk高5.5%。通過觀察知道,在容量為20 kbit/s時(shí)兩者的傳輸率相同,但PESQ MOS分?jǐn)?shù)卻不一致,合理的解釋就是GTalk出現(xiàn)了很嚴(yán)重的網(wǎng)絡(luò)抖動情況(如圖4所示)。

圖2 吞吐量隨信道容量變化狀況

圖3 PESQ MOS隨信道容量變化狀況

圖4 平均抖動隨信道容量變化狀況

  4.2 時(shí)延影響

  網(wǎng)絡(luò)參數(shù)設(shè)置為信道容量50 kbit/s且沒有丟包和抖動發(fā)生。確定幾個(gè)等級范圍,其中時(shí)延為1 ms、10 ms、100 ms時(shí)通話是可以接受的,時(shí)延為500 ms、1 000 ms時(shí)語音質(zhì)量就變得不可接受。對于Skype,時(shí)延對其服務(wù)質(zhì)量的影響更為明顯,如圖5所示,傳輸率從37.5 kbit/s降為19.36 kbit/s。然而,對于GTalk其傳輸率則沒有明顯變化。由圖6可知,在時(shí)延為1 ms、10 ms、100 ms時(shí)Skype的PESQ MOS高于GTalk,在時(shí)延為500 ms、1 000 ms時(shí)GTalk則略優(yōu)于Skype。

圖5 不同時(shí)延下吞吐量的變化狀況

圖6 PESQ MOS隨時(shí)延的變化狀況

  4.3 丟包影響

  設(shè)置信道容量為50 kbit/s,時(shí)延為25 ms,沒有抖動,丟包率分別定為0、1%、5%、10%、30%、40%。如圖7所示,GTalk對于丟包發(fā)生,沒有適應(yīng)性機(jī)制?梢栽O(shè)想Skype對數(shù)據(jù)流增加了冗余信息來減少丟包對語音質(zhì)量的影響,這就解釋了在丟包率為1%、5%、10%時(shí)傳輸率的增長。然而,Skype的這些適應(yīng)機(jī)制并沒有使得PESQ MOS分?jǐn)?shù)比GTalk高,如圖8所示。在丟包率為5%時(shí),Skype添加了過多的冗余,消耗了過多的網(wǎng)絡(luò)帶寬,而PESQ MOS并沒有期待中的提高。

圖7 不同丟包率下的吞吐量的變化狀況

圖8 不同丟包率下的PESQ MOS變化狀況

  4.4 抖動影響

  設(shè)置信道容量為50 kbit/s,沒有丟包,時(shí)延為100 ms,抖動為0 ms、20 ms、40 ms、60 ms、80 ms。但是測量數(shù)據(jù)沒有顯示出任何適應(yīng)性的跡象。在本實(shí)驗(yàn)中抖動只是改變了接收端的緩沖區(qū)大小,對數(shù)據(jù)流傳送沒有任何影響,并且實(shí)驗(yàn)結(jié)果也顯示PESQ MOS或者說語音質(zhì)量與抖動沒直接關(guān)系,具體的實(shí)驗(yàn)圖示不再贅述。

  4.5 實(shí)驗(yàn)分析

  雖然實(shí)驗(yàn)比較了VoIP的兩個(gè)應(yīng)用GTalk與Skype,但目的不是要分出它們的優(yōu)劣,而是要找出普遍存在問題,給VoIP的應(yīng)用開發(fā)商提出建議。

  采用不同的編解碼方式,其對應(yīng)的業(yè)務(wù)質(zhì)量可能不同。即使是使用相同的編解碼方式,也可能會表現(xiàn)出不同的語音質(zhì)量。對于VoIP的應(yīng)用來說,具有高效的適應(yīng)機(jī)制來適應(yīng)復(fù)雜可變的網(wǎng)絡(luò)環(huán)境相當(dāng)重要,適應(yīng)性好的應(yīng)用會更有優(yōu)勢,例如,當(dāng)帶寬有限時(shí),GTalk始終保持一個(gè)較高的傳輸率,從而產(chǎn)生了嚴(yán)重的抖動和PESQ MOS分?jǐn)?shù)的下降。另一方面,Skype在有較高時(shí),傳輸率有明顯的下降,導(dǎo)致業(yè)務(wù)質(zhì)量更糟。

  數(shù)據(jù)流中添加冗余信息可能會產(chǎn)生好的效果,如圖7、8所示,當(dāng)丟包率小于10%時(shí),Skype可以使PESQ MOS的分?jǐn)?shù)保持在3分之上,GTalk沒有采用適應(yīng)性機(jī)制,從而其語音質(zhì)量隨著丟包率而線性下降。但是,也需要對添加冗余信息的量度有一個(gè)把握,否則會產(chǎn)生不好的效果,因此還需要進(jìn)一步地提出更有效的冗余設(shè)計(jì)方案來適應(yīng)可變網(wǎng)絡(luò)。

5、結(jié)束語

  本實(shí)驗(yàn)比較了P2P VoIP的兩個(gè)應(yīng)用Skype和Gtalk,討論了它們在網(wǎng)絡(luò)狀況變化時(shí)的動態(tài)適應(yīng)策略,并且通過PESQ MOS方法評估了它們語音質(zhì)量的優(yōu)劣。通過實(shí)驗(yàn)可知:在理想的網(wǎng)絡(luò)狀況下,Skype表現(xiàn)得更好一些(兩者PESQ MOS的分?jǐn)?shù)差別為0.1),總體而言它們的語音質(zhì)量還是較為接近。在網(wǎng)絡(luò)有較長的時(shí)延時(shí),Skype有不必要的適應(yīng)性。當(dāng)丟包情況發(fā)生時(shí),GTalk沒有實(shí)施任何機(jī)制來提高其性能,與此同時(shí),Skype使用數(shù)據(jù)冗余機(jī)制來對抗丟包以提高其語音質(zhì)量。在抖動情況發(fā)生時(shí),兩者都沒有很好的機(jī)制來提高其適應(yīng)性。當(dāng)有較長的時(shí)延時(shí),PESQ MOS并不是最佳的評估語音質(zhì)量的方法。所以,盡管實(shí)驗(yàn)中包含有時(shí)延對語音質(zhì)量的影響結(jié)果,但這可能不是十分準(zhǔn)確,有待于進(jìn)一步研究。另外,以上的實(shí)驗(yàn)是Skype與GTalk分別進(jìn)行,之間沒有相互影響,若是VoIP的具體應(yīng)用需要競爭相同的網(wǎng)絡(luò)資源時(shí),它們的表現(xiàn)情況如何研究者需要進(jìn)一步的研究。

參考文獻(xiàn)

  1 朱海毅,周春楠.VoIP基本原理.信息技術(shù).2003,5(5)

  2 Shen Q.Performance of VoIP over GPRS.In:17th International Conference.on Advanced Information Networking and Applications(AINA’03),2003

  3 Furuya H,Nomoto S,Yamada H.Experimental investigation of the relationship between IP network performances and speech quality of VoIP.In:10th International Conference on Telecommunications(ICT 2003),March 2003

  4 Salman A B,Henning S.An analysis of the peer-to-peer Internet telephony protocol.In:IEEE INFOCOM 2006,April 2006

  5 Guha S,Daswani N,Jain R.An experimental study of the skype peer-to-peer VoIP system.In:5th Workshop on Peer-to-Peer Systems(IPTPS),F(xiàn)ebruary 2006

  6 International Telecommunications Union.Methods for subjective determination of transmission quality. Recommendation P.800,August 1996

  7 International Telecommunications Union.The E-model,a computational model for use in transmission planning. Recommendation G.107,1998

  8 吳耀文,王平.VoIP語音評價(jià)方法綜述.艦船電子工程,2006(1)

  9 Miras D.A survey on network QoS needs of advanced Internet applications. Internet QoS Working Group,2002

電信科學(xué)



相關(guān)鏈接:
企業(yè)Skype暴露內(nèi)網(wǎng)隱私 2008-09-24
創(chuàng)造性地滿足本地客戶的需求─訪Avaya中國區(qū)總經(jīng)理 2008-09-23
Spirent辛小秋:VOIP方面的測試方法和經(jīng)驗(yàn) 2008-09-19
大唐高鴻張新中:構(gòu)建安全高效融合通信系統(tǒng) 2008-09-19
高清 會議 網(wǎng)絡(luò)增值成IP電話突破口 2008-09-18

分類信息: