移動流媒體技術(shù)的視頻編碼協(xié)議及標準
馮開江 2009/06/26
一、流媒體主要技術(shù)特征
近年來,移動數(shù)字電視、手機電視、IPTV等數(shù)字新媒體迅速涌現(xiàn),其相關(guān)技術(shù)及標準成為業(yè)界關(guān)注的焦點,而流媒體技術(shù)在其中更是一枝獨秀。流媒體是指視頻、聲音等數(shù)據(jù)以實時傳輸協(xié)議承載,并以連續(xù)的流的形式從源端向目的端傳輸,在目的端接收到一定緩存數(shù)據(jù)后就可以播放出來的多媒體應(yīng)用。
流媒體采用流式傳輸方式在網(wǎng)絡(luò)服務(wù)器與客戶端之間進行傳輸,它的協(xié)議的設(shè)計和制定就是為了實現(xiàn)流媒體服務(wù)器和客戶端的通訊,流媒體傳輸協(xié)議無疑成為流媒體技術(shù)的重中之重。流媒體按傳輸方式的不同分為:順序流(ProgressiveStreaming)傳輸和實時流(RealTimeStreaming)傳輸。順序流傳輸是順序下載,在下載文件的同時用戶可以觀看在線媒體,在特定時刻用戶只能觀看已下載的那部分,而不能跳到還未下載的部分。順序流傳輸基于HTTP協(xié)議,也稱為HTTP流式傳輸,用標準的WEB服務(wù)器就可以實現(xiàn)順序流式服務(wù)。實時流傳輸基于實時傳輸協(xié)議(RTP)或微軟公司專有的多媒體協(xié)議,實時流傳輸能保證媒體信號帶寬與網(wǎng)絡(luò)匹配,使媒體可以被實時觀看。實時傳輸協(xié)議RTP是最典型、最廣泛的服務(wù)于流媒體的傳輸層協(xié)議,通常運行于UDP協(xié)議上,也可以基于AAL5/ATM或IPX等無連接的通信協(xié)議,提供端到端的服務(wù),與具體的承載網(wǎng)絡(luò)分離。RTP協(xié)議本身包括兩部分:RTP數(shù)據(jù)傳輸協(xié)議和RTCP傳輸控制協(xié)議。為了可靠、高效地傳送實時數(shù)據(jù),RTP和RTCP必須配合使用,通常RTCP包的數(shù)量占所有傳輸量的5%。RTCP協(xié)議作為RTP協(xié)議的一個重要的控制補充協(xié)議,以它的反饋機制實現(xiàn)對流媒體服務(wù)的QoS控制,配合傳輸層協(xié)議,保證了流媒體的實時性特征,滿足了在IP網(wǎng)上對QoS的需求。同時在傳輸包文件中還包含資源預(yù)定協(xié)議RSVP(ResourceReservationProtocol),它通過預(yù)留一部分網(wǎng)絡(luò)資源(帶寬)的措施,在一定程度上為流媒體實時流傳輸提供QoS保證。雖說在理論上RTP的底層傳輸協(xié)議也可以采用TCP協(xié)議,但在現(xiàn)在的應(yīng)用中幾乎都采用的是RTP/UDP模式。
把流媒體技術(shù)應(yīng)用到移動網(wǎng)絡(luò)和終端上,為移動用戶提供在線的不間斷的聲音、影像或動畫等多媒體服務(wù),而無須用戶事先將其下載到本地的技術(shù)稱之為移動流媒體技術(shù)。我國現(xiàn)在已開發(fā)出基于自主知識產(chǎn)權(quán),面向3G和2.75G的移動流媒體平臺,并率先在CDMA1X、GPRS等2.5G移動網(wǎng)絡(luò)上實現(xiàn)了6幀/秒以上流暢音視頻內(nèi)容實時直播、點播和下載播放及互動服務(wù),F(xiàn)在完整的移動流媒體平臺,可提供從前端的內(nèi)容編碼轉(zhuǎn)換、制作到終端解碼、播放,以及服務(wù)器端內(nèi)容分發(fā)、播出管理等,而且可以實現(xiàn)移動音視頻短信、移動音視頻直播等,從而可以構(gòu)成了完整的移動流媒體產(chǎn)品產(chǎn)業(yè)鏈。
二、移動流媒體核心技術(shù)協(xié)議——H.264協(xié)議
移動流媒體傳輸視頻數(shù)據(jù)都采用H.264視頻壓縮算法進行壓縮,以適合無線傳輸?shù)牡蛶捑幋a(15-25kpbs)可以傳輸更好質(zhì)量的圖像,或者用更少的帶寬傳輸相同質(zhì)量的視頻。
H.264/MPEG-4AVC是目前最新、最有前途的視頻壓縮標準。H.264是由ITU-T和ISO/IEC組成的聯(lián)合視頻組(JVT)共同開發(fā)的最新國際視頻編碼標準。國際電信聯(lián)盟將其命名為H.264/AVC。國際標準化組織和國際電工委員會將其稱為14496-10/MPEG-4AVC。通過該標準,在同等圖像質(zhì)量下的壓縮效率比以前的標準提高了2倍以上,因此,H.264被普遍認為是最有影響力的行業(yè)標準。
H.264標準只有三個子集:基本子集、主題子集和擴展子集。基本子集是專為視頻會議應(yīng)用設(shè)計的,這套標準幾近完美,能夠提供強大的差錯隱消技術(shù)。應(yīng)用該技術(shù),即使在Internet這樣的易錯網(wǎng)絡(luò)上也可以得到較好的視頻效果,并且支持低延時編/解碼技術(shù),使視頻會議顯得更自然。主題子集和擴展子集更適合于電視應(yīng)用(數(shù)字廣播、DVD)和延時顯得并不很重要的視頻流應(yīng)用。
H.264協(xié)議最大的優(yōu)勢體現(xiàn)在以下10個方面:
- 將每個視頻幀分離成由像素組成的塊;
- 采用空間冗余的方法,對視頻幀的一些原始塊進行空間預(yù)測、轉(zhuǎn)換、優(yōu)化和可變長編碼;
- 對連續(xù)幀的不同塊采用臨時存放的方法,這樣,只需對連續(xù)幀中有改變的部分進行編碼;
- 采用剩余空間冗余技術(shù),對視頻幀里的殘留塊進行編碼;
- 在同等的還原圖像質(zhì)量的情況下,H.264要比MPEG-4節(jié)省50%以上的碼率;
- 允許流媒體在更低的帶寬上傳輸,節(jié)省帶寬資源適用性強;
- 具備從電話應(yīng)用到高端廣播和存儲應(yīng)用的各種類型;
- 有較強的容錯能力,在質(zhì)量不穩(wěn)定的網(wǎng)絡(luò)環(huán)境中,可以得到較好的質(zhì)量;
- 低處理時延:為了保證解碼的視頻獲得很好的質(zhì)量,視頻數(shù)據(jù)的處理和傳輸時延必須最小化。在編碼過程一個較大的處理時延會導致視頻隊列重新組合的混亂。時延是編碼、網(wǎng)絡(luò)和解碼時延的總和。為了將時延最小化,必須在編碼和解碼過程中進行最小時延的處理;
- 優(yōu)秀的圖像質(zhì)量。
H.264編碼的特征在于:
- 低碼流:和MPEG-2和MPEG-4ASP等壓縮技術(shù)相比,在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG-2的1/8,MPEG-4的1/3。顯然,H.264壓縮技術(shù)的采用將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費;
- 高質(zhì)量的圖像:H.264能提供連續(xù)流暢的高質(zhì)量圖像;
- 容錯能力強:H.264提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯誤的必要工具;
- 網(wǎng)絡(luò)適應(yīng)性強:H.264提供了網(wǎng)絡(luò)適應(yīng)層(NetworkAdaptationLayer),使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸。
H.264協(xié)議的優(yōu)勢和特征說明,雖然早期的視頻編碼標準如MPEG-4和H.263可以為移動應(yīng)用提供充分的視頻圖像質(zhì)量,但最新的視頻編碼標準H.264可以將移動應(yīng)用面擴大和提供更強有力的服務(wù),因此H.264協(xié)議會成為移動流媒體技術(shù)的核心協(xié)議。
三、移動流媒體中的音視頻編碼標準
眾所周知,系統(tǒng)之間的互操作性、兼容性和可擴展性至關(guān)重要,而保持這些的關(guān)鍵就是需要制定設(shè)備制造商及運營商在制造產(chǎn)品及提供服務(wù)過程中必須遵守共同的開放標準。在移動流媒體方面,已經(jīng)有數(shù)個音、視頻壓縮標準及基于包傳輸?shù)臉藴实玫搅溯^充分的發(fā)展。而通過對視頻編碼標準的壓縮效率、可擴展性、容錯能力及占用的運算資源等因素加以折衷考慮可以認為,最適合目前移動通信技術(shù)及移動終端制造水平的應(yīng)該是H.264視頻編碼標準。
2.1 視頻編碼標準
近年來,國際電信聯(lián)盟VCEG(視頻編碼專家組)和ISO的MPEG(活動圖像專家組)的專家們組建了JVT(聯(lián)合視頻小組)共同研究視頻圖像的高效壓縮編碼。他們制定的標準被分別稱為H.264和MPEG-4高級視頻編碼。在信息產(chǎn)業(yè)部和中國科學院支持下,中國音視頻編碼標準化工作組也制定了適合于移動流媒體的視頻編碼標準AVS-M。這些編碼標準不僅能夠適應(yīng)相對惡劣的無線傳輸環(huán)境,還能滿足移動流媒體傳輸系統(tǒng)在傳輸質(zhì)量、傳輸速度及傳輸時延等方面的要求。下面我們首先以AVS-M視頻編碼標準為例,對這些特性加以簡單的描述:
高壓縮比及低運算量
一般來說,無線信道所能提供的帶寬或數(shù)據(jù)比特率是受限的,而且與移動終端用戶在無線鏈路上傳送的總數(shù)據(jù)量成正比,這就要求流媒體傳輸系統(tǒng)在對流媒體進行編碼時,要有較高的壓縮效率,尤其對視頻編碼更是如此。AVS-M視頻壓縮標準提供了包括宏塊內(nèi)運動矢量,無限運動矢量,幀內(nèi)預(yù)測等視頻壓縮工具,從而可以較好地滿足無線流媒體應(yīng)用對高壓縮比的要求。
在選擇視頻編碼標準的時候,不僅要考慮獲得高壓縮比,還要根據(jù)目前移動終端的硬件環(huán)境考慮到該標準的運算復(fù)雜度。采用較高計算復(fù)雜度的編解碼標準不僅會提高移動終端的硬件成本,而且由于功耗的增加,會減少移動終端的電源持續(xù)時間。和以前的編碼標準相比,AVS-M的實現(xiàn)復(fù)雜度更加適合無線流媒體的應(yīng)用。
傳輸速率可擴展性
同時,為了適應(yīng)各類應(yīng)用對碼速率的要求及無線鏈路實際狀況,音視頻編碼器應(yīng)該能調(diào)整諸如幀的大小、幀頻及解析度等參數(shù)。AVS-M編碼器就可以通過調(diào)整這些參數(shù),使得編碼后的視頻流具備多樣的數(shù)據(jù)速率,從而滿足移動流媒體應(yīng)用對編碼器可擴展性的要求。
高容錯性
相對于有線傳輸信道,移動通信所要使用的無線傳輸信道環(huán)境要惡劣得多,數(shù)據(jù)包的接收誤碼率要高出幾個數(shù)量級。而壓縮視頻流對誤碼非常敏感,即使接收到數(shù)據(jù)包的誤碼率很低,也會對解碼后的圖像質(zhì)量造成很嚴重的影響。這是由于壓縮編碼去掉了原運動圖像中所包含的大部分空間域及時間域上的冗余信息,編碼后的視頻流即使僅僅出現(xiàn)一個比特的錯誤,也會使得解碼后的圖像中有很大一部分空間域及時間域圖像數(shù)據(jù)受到影響無法正常解碼顯示。而如果受數(shù)據(jù)包誤碼影響的幀是作為后面預(yù)測幀的參考幀時,造成一個數(shù)據(jù)包的誤碼會向后面的圖像幀擴散,從而使得解碼后圖像質(zhì)量的惡化情況更加嚴重。為了盡量降低AVS-M視頻流對誤碼的敏感性,以保證壓縮視頻解壓后的恢復(fù)質(zhì)量,AVS-M提供了多種抗誤碼工具,承載流媒體業(yè)務(wù)的實時網(wǎng)絡(luò)傳輸層及底層移動通信系統(tǒng)也可以進一步改善流媒體傳輸?shù)目拐`碼性能。
2.2 音頻編碼標準
在音頻編碼標準的制定上,目前無線多媒體標準組織將注意力集中到幾個現(xiàn)存的蜂窩通信語音編碼標準上。這些標準包括應(yīng)用于GSM并得到3GPP支持的AMR(AdaptiveMulti-Rate)編碼算法以及應(yīng)用于CDMA得到3GPP2支持的EVRC(EnhancedVariableRateCoder)編碼算法,這兩種算法都具有良好的抗誤碼能力。
MPEG-4音頻包括如MPEG-4AAC(AdvancedAudioCoding)等音頻編碼標準,以支持寬帶、可擴展音頻通信。
2.3 第三代移動流媒體傳輸標準
3G-324M作為3GPP提出的第三代移動通信流媒體傳輸標準,可確保有線視頻傳輸系統(tǒng)與第三代移動視頻傳輸系統(tǒng)之間的互操作性。它與ITU-TH.324中的視訊會議標準有較緊密的聯(lián)系。3G-324M適用于UMTS移動網(wǎng)絡(luò)中的64kbit/s電路交換鏈路,其復(fù)用協(xié)議為H.223;控制協(xié)議為H.245;視頻編碼器采用H.264及MPEG-4;缺省語音編碼器則為GSM-AMR和G.723.1。3GPP2將類似的標準集應(yīng)用于3GPP2無線網(wǎng)絡(luò)電路交換視頻會議業(yè)務(wù)。最近,3GPP采納了基于IP協(xié)議的流媒體傳輸架構(gòu),該協(xié)議規(guī)定了控制信令、背景描述、媒體傳輸、媒體封裝及動靜態(tài)圖像、語音、文本的編解碼等標準,推薦了基于流媒體技術(shù)的H.264作為MPEG-4視音頻流媒體網(wǎng)絡(luò)傳輸協(xié)議。
四、結(jié)語
伴隨著移動通信技術(shù)的飛速發(fā)展,移動運營商可以為用戶提供基于移動流媒體技術(shù)的豐富應(yīng)用。可以隨時隨地在移動終端上點播和下載高質(zhì)量的音樂和MTV,收看收聽電視臺的直播節(jié)目,欣賞精彩的電視劇和電影片,體驗激烈的體育賽事,實現(xiàn)遠程實時監(jiān)控和交通路況查詢,以及開展各行各業(yè)的專項應(yīng)用。移動流媒體技術(shù)也是廣電與電信技術(shù)和業(yè)務(wù)融合發(fā)展到一定階段的產(chǎn)物,具有廣電與電信的“雙重屬性”,它的出現(xiàn)也體現(xiàn)了“三網(wǎng)融合”的發(fā)展趨勢。隨著技術(shù)的普及和發(fā)展,移動流媒體業(yè)務(wù)將在某種程度上改變?nèi)藗兊纳罘绞,進一步開拓獲取信息和休閑娛樂的途徑。隨著移動通信網(wǎng)絡(luò)和廣播電視內(nèi)容分發(fā)技術(shù)的不斷發(fā)展和完善,特別是3G時代的到來,它最高2Mbp的傳輸速率,能達到電視實時傳輸?shù)男Ч,移動流媒體增值業(yè)務(wù)已經(jīng)成為話音業(yè)務(wù)之外重要的利潤增長點,對未來移動通信起到一種新的支撐市場的應(yīng)用,移動流媒體增值業(yè)務(wù)將為我們帶來一個無限的前景。
慧聰廣電網(wǎng)
相關(guān)鏈接: