H.264標(biāo)準(zhǔn)及其在視頻會(huì)議系統(tǒng)應(yīng)用

2005/03/25

1、引言

　　視頻會(huì)議系統(tǒng)是一種可以在兩點(diǎn)或多點(diǎn)間實(shí)現(xiàn)實(shí)時(shí)傳送視頻、音頻和應(yīng)用數(shù)據(jù)等多種信息、具有會(huì)議功能的多媒體通信系統(tǒng)。近年來，隨著我國通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施的快速建設(shè)和經(jīng)濟(jì)的飛速發(fā)展，會(huì)議電視業(yè)務(wù)由于可以為處于兩點(diǎn)或多點(diǎn)的與會(huì)者提供視音頻和數(shù)據(jù)等多種信息，節(jié)省大量費(fèi)用，提高工作效率而發(fā)展迅速，并有望成為下一代網(wǎng)絡(luò)(NGN)的主要業(yè)務(wù)。H.264是由ITU-T和ISO兩個(gè)組織的專家為實(shí)現(xiàn)視頻的更高壓縮比，更好的圖像質(zhì)量和良好的網(wǎng)絡(luò)適應(yīng)性而提出的新的視頻編解碼標(biāo)準(zhǔn)。事實(shí)證明，H.264編碼具有比其他的H系列視頻壓縮標(biāo)準(zhǔn)節(jié)省碼流，比MPEG-4算法簡單的特點(diǎn)。H.264的良好網(wǎng)絡(luò)適應(yīng)性和內(nèi)在的抗丟包能力、抗誤碼機(jī)制，使它不僅適于IP傳輸方式，也適合丟包嚴(yán)重、時(shí)延和抖動(dòng)復(fù)雜的無線信道。H.264有望成為多媒體通信中首選的視頻編解碼標(biāo)準(zhǔn)。

2、視頻會(huì)議系統(tǒng)對(duì)視頻編解碼的要求

　　視頻會(huì)議系統(tǒng)從產(chǎn)生至今，ITU-T制定了多種適合于各類通信網(wǎng)絡(luò)的標(biāo)準(zhǔn)，目前通信網(wǎng)上傳輸多媒體信息的系統(tǒng)主要有H.320(基于ISDN)，H.324(包括H.324I，H.324P和H.324M)，H.31O(基于ATM)和H.323(基于LAN)四類系統(tǒng)。隨著IP問題(安全和QoS問題)的逐步解決，以IP作為承載網(wǎng)的優(yōu)勢(shì)將更加明顯，下一代網(wǎng)絡(luò)也將采用IP技術(shù)作為承載網(wǎng)技術(shù)，因此本文以適用于在IP網(wǎng)上提供多媒體業(yè)務(wù)的H.323系統(tǒng)為主進(jìn)行闡述。

　　視頻會(huì)議系統(tǒng)對(duì)視頻編解碼標(biāo)準(zhǔn)的具體要求是：

　　(1)由于目前IP網(wǎng)絡(luò)接入方式有LAN接入，Ethernet，xDSL等多種方式，一些接入方式如xDSL可提供的帶寬有限，除去音頻、數(shù)據(jù)占用的帶寬，傳輸視頻的可用帶寬更少，要求視頻編解碼高效，壓縮率高。

　　(2)網(wǎng)絡(luò)適應(yīng)性好，便于視頻流在網(wǎng)絡(luò)中傳輸，

　　(3)抗丟包性能和抗誤碼性能好，適應(yīng)各種網(wǎng)絡(luò)環(huán)境，包括丟包和誤碼嚴(yán)重的無線網(wǎng)絡(luò)。

3、H.264編碼的技術(shù)優(yōu)勢(shì)

　　由于H.264在制定時(shí)就充分考慮了多媒體通信對(duì)視頻編解碼的各種要求，并借鑒了H系列和MPEG系列視頻標(biāo)準(zhǔn)的研究成果，因而具有明顯的優(yōu)勢(shì)。結(jié)合視頻會(huì)議系統(tǒng)對(duì)視頻編解碼技術(shù)的要求，H.264的優(yōu)勢(shì)表現(xiàn)在以下三個(gè)方面：

　　3.1　壓縮率和圖像質(zhì)量方面

　　H.264通過對(duì)傳統(tǒng)的幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、變換編碼和熵編碼等算法的改進(jìn)來進(jìn)一步提高編碼效率和圖像質(zhì)量。

　　(1)塊的大小可變。在運(yùn)動(dòng)估計(jì)時(shí)，可以靈活地選擇塊的大小。在宏塊(MB)劃分上，H.264采用了16×6，16×8，8×16，8×8四種模式；當(dāng)劃分為8×8模式時(shí)，又可進(jìn)一步采用8×4，4×8，4×4三種子宏塊劃分模式(見圖1)進(jìn)一步劃分，這樣做既可以使運(yùn)動(dòng)物體的劃分更加精確，減小運(yùn)動(dòng)物體邊緣的銜接誤差，又可以減小變換過程中的計(jì)算量。當(dāng)對(duì)較大的平滑區(qū)域采用Intra_16×16的幀間預(yù)測(cè)方式時(shí)，為減小小尺寸變換帶來的塊間灰度差異，H.264采用了對(duì)亮度數(shù)據(jù)的16個(gè)4×4塊的DC系數(shù)進(jìn)行第二次4×4變換，對(duì)色度數(shù)據(jù)的4個(gè)4×4塊的DC系數(shù)進(jìn)行22變換的方式。

圖1　宏塊劃分和子宏塊劃分

　　(2)1/4像素精度的運(yùn)動(dòng)估值。在H.264中通過6階FIR濾波器的內(nèi)插獲得1/2像素位置的預(yù)測(cè)值。當(dāng)1/2像素值獲得后，通過取整數(shù)像素位置和1/2像素位置像素值均值的方式獲得1/4像素位置的值。采用高精度運(yùn)動(dòng)估計(jì)會(huì)進(jìn)一步減小幀間預(yù)測(cè)誤差，減少了經(jīng)變換和量化后的非O比特?cái)?shù)，提高了編碼效率。

　　(3)多參考幀運(yùn)動(dòng)估值。以往的編解碼技術(shù)在對(duì)P幀(場(chǎng))圖像進(jìn)行幀間預(yù)測(cè)時(shí)，只允許以前一個(gè)I圖像或P圖像為參考幀，對(duì)B圖像進(jìn)行預(yù)測(cè)時(shí)只允許以前后兩個(gè)I圖像或P圖像為參考圖像。H.264則打破了這些限制，允許在Reference Buffer中的多個(gè)圖像中選取一個(gè)(P預(yù)測(cè)方式)或兩個(gè)(B預(yù)測(cè)方式)圖像作為參考圖像，參考圖像甚至可以是采用雙向預(yù)測(cè)編碼方式的圖像。

　　(4)參考圖像的選取與其編碼方式無關(guān)。允許選取與當(dāng)前圖像更加匹配的圖像為參考圖像進(jìn)行預(yù)測(cè)，減小了預(yù)測(cè)誤差，提高編碼效率。

　　(5)加權(quán)預(yù)測(cè)。允許編碼器以一定的系數(shù)對(duì)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)值進(jìn)行加權(quán)，從而在一定的場(chǎng)景下可以提高圖像質(zhì)量。

　　(6)Intra_4×4模式的幀間預(yù)測(cè)。在這種模式下，每個(gè)4×4塊都可以利用其上方和左側(cè)的17個(gè)最接近的像素進(jìn)行預(yù)測(cè)。

　　(7)循環(huán)內(nèi)的消除塊效應(yīng)濾波器。為消除在預(yù)測(cè)和變換過程中引入的塊效應(yīng)，H.264也采用了消除塊效應(yīng)濾波器，但與以往標(biāo)準(zhǔn)不同的是，H.264的消除塊效應(yīng)濾波器位于運(yùn)動(dòng)估計(jì)循環(huán)內(nèi)部，可以利用消除塊效應(yīng)以后的圖像去預(yù)測(cè)其它圖像的運(yùn)動(dòng)，進(jìn)一步提高預(yù)測(cè)精度。濾波強(qiáng)度取決于宏塊的預(yù)測(cè)方式、量化參數(shù)、運(yùn)動(dòng)矢量等。量化步長減小時(shí)，濾波器的作用也會(huì)相應(yīng)降低。

　　(8)更好的熵編碼算法CAVLC和CABAC。

　　3.2　網(wǎng)絡(luò)適應(yīng)性方面

　　為了方便地在各種系統(tǒng)中靈活有效的應(yīng)用H.264，H.264編解碼系統(tǒng)(見圖2)定義了視頻編碼層VCL和網(wǎng)絡(luò)提取層NAL。其中，VCL用于視頻編解碼，包括運(yùn)動(dòng)補(bǔ)償，變換編碼和熵編碼等單元，NAL用于采用統(tǒng)一的格式對(duì)VCL視頻數(shù)據(jù)的進(jìn)行封裝打包。

圖2　H.264編碼器結(jié)構(gòu)

　　(1)NAL Units。視頻數(shù)據(jù)封裝在整數(shù)字節(jié)的NALU中，它的第一個(gè)字節(jié)標(biāo)志該單元中數(shù)據(jù)的類型。H.264定義了兩種封裝格式�；诎粨Q的網(wǎng)絡(luò)系統(tǒng)可以使用RTP封裝格式封裝NALU，并且可以通過在NALU后面增加一個(gè)16位的信息域的方式將多個(gè)NALU放在一個(gè)RTP中傳輸。另一些系統(tǒng)，如H.320系統(tǒng)或MPEG-2系統(tǒng)可能會(huì)要求將NALU作為順序比特流傳送，為方便在這些系統(tǒng)中使用H.264，H.264定義了一種比特流格式的傳輸機(jī)制，使用頭編碼前綴(start code prefix)將NALU封裝起來，并用一個(gè)有限狀態(tài)機(jī)來保證頭編碼前綴不會(huì)出現(xiàn)在它封裝的NALU中，防止了錯(cuò)誤定界的發(fā)生。

　　(2)參數(shù)集。在以往視頻編解碼標(biāo)準(zhǔn)中，GOB\GOP\圖像頭信息是至關(guān)重要的，包含這些信息的包的丟失將直接導(dǎo)致與這些信息相關(guān)的數(shù)據(jù)不可用，因此這些標(biāo)準(zhǔn)大都采用了冗余編碼技術(shù)來保護(hù)這些頭信息。為解決這些問題，H.264將這些很少變化并且對(duì)大量VCL NALU起作用的信息放在參數(shù)集中傳送。參數(shù)集分為兩種，即序列參數(shù)集sequence parameter set和圖像參數(shù)集picture parameter set，前者對(duì)一系列連續(xù)編碼圖像起作用，后者對(duì)連續(xù)編碼圖像序列中的單獨(dú)圖像起作用。VCL NALU通過標(biāo)識(shí)位來指定它所參考的參數(shù)集。為適應(yīng)多種網(wǎng)絡(luò)環(huán)境，參數(shù)集可以帶內(nèi)傳送，也可以采用帶外方式傳送。

　　3.3　抗丟包和抗誤碼方面

　　在H.264中，參數(shù)集，片的使用，F(xiàn)MO，冗余片等關(guān)鍵技術(shù)的使用可以大大提高系統(tǒng)的抗丟包和抗誤碼性能。

　　(1)參數(shù)集的使用。參數(shù)集及其靈活傳送方式的使用本身會(huì)大大降低因關(guān)鍵的頭信息丟失而造成錯(cuò)誤發(fā)生的可能。為保證參數(shù)集可靠的到達(dá)解碼器端，可以采用重發(fā)的方式多次發(fā)送同一參數(shù)集，傳送多個(gè)參數(shù)集或?qū)?shù)集固化在解碼器中。

　　(2)片(slice)的使用。在不使用FMO時(shí)，片是一系列宏塊按照光柵掃描順序的組合。圖像可以劃分成一個(gè)或幾個(gè)片。片是獨(dú)立的，也就是說，在編碼器和解碼器使用的參考圖像一致的情況下，只要給定序列參數(shù)集和圖像參數(shù)集，片的語法元素和該片圖像采樣值就可以從碼流中解析出來，而不需要其他片的數(shù)據(jù)(片邊緣消除塊效應(yīng)濾波過程可能會(huì)需要其他相鄰片的數(shù)據(jù))。將圖像劃分為多個(gè)片，當(dāng)某一片不能正常解碼時(shí)的空間視覺影響就會(huì)大大降低，而且片的頭部還提供了重同步點(diǎn)。

　　(3)FMO技術(shù)。通過FMO可以進(jìn)一步提高片的差錯(cuò)恢復(fù)能力。通過片組(slice group)的使用，F(xiàn)MO改變了圖像劃分為片和宏塊的方式。宏塊到片組的映射定義了宏塊屬于哪一個(gè)片組。利用FMO技術(shù)，H.264定義了7種宏塊掃描模式。

　　如圖3所示，陰影部分宏塊屬于片組0，白色部分屬于片組1。假設(shè)片組O在傳輸過程中丟失，由于丟失宏塊的相鄰宏塊都屬于片組1，這樣差錯(cuò)恢復(fù)工具就會(huì)有更多的可利用信息來恢復(fù)丟失片的數(shù)據(jù)。

圖3　一種宏塊掃描模式

　　(4)幀內(nèi)預(yù)測(cè)。H.264借鑒了以往視頻編解碼標(biāo)準(zhǔn)在幀內(nèi)預(yù)測(cè)上的經(jīng)驗(yàn)，值得注意的是，在H.264中，IDR圖像可以使短期參考圖像緩存無效，之后的圖像解碼時(shí)不再參考IDR圖像之前的圖像，因而IDR圖像具有強(qiáng)壯的重同步性能。在一些丟包和誤碼嚴(yán)重的信道中，可以采取不定期傳送IDR圖像的方式進(jìn)一步提高H.264的抗誤碼和抗丟包性能。

　　(5)冗余片。為提高H.264的解碼器在發(fā)生數(shù)據(jù)丟失時(shí)的健壯性，可以采用傳送冗余片的方式。這些冗余片可以是基本圖像的一部分。冗余片和基本片可以采用不同的編碼參數(shù)，當(dāng)基本片丟失時(shí)，可以通過冗余片重構(gòu)原圖像。

　　(6)數(shù)據(jù)劃分。由于運(yùn)動(dòng)矢量和宏塊類型等信息相對(duì)于其他信息具有更高的重要性，因而在H.264中引入了數(shù)據(jù)劃分的概念，將片中語義彼此相關(guān)的語法元素放在同一個(gè)劃分中。在H.264中有三種不同的數(shù)據(jù)劃分。第一類劃分中包含頭信息等重要信息，如宏塊類型、量化參數(shù)和運(yùn)動(dòng)矢量等，稱為A類劃分。第二類劃分包含幀內(nèi)CPB和幀內(nèi)系數(shù)，稱為B類劃分。第三類劃分包含幀間CBPs和幀間系數(shù)，稱為C類劃分。若解碼器發(fā)現(xiàn)幀內(nèi)信息或幀間信息丟失，由于宏塊類型和運(yùn)動(dòng)矢量等重要信息的存在，仍然可以使差錯(cuò)恢復(fù)工具具有良好的性能。

　　(7)多參考幀運(yùn)動(dòng)估值。多參考幀運(yùn)動(dòng)估值的一個(gè)作用是可以提高編碼器的編碼效率，另一個(gè)作用是提高差錯(cuò)恢復(fù)能力。在有反饋的系統(tǒng)(如采用RTP/RTCP作為應(yīng)用層傳輸協(xié)議的通信系統(tǒng))中，當(dāng)編碼器得知有圖像丟失時(shí)，可以選擇解碼器已經(jīng)正確接收的圖像作為參考圖像。

　　(8)為阻止錯(cuò)誤在空間上的蔓延，解碼器端可以指定當(dāng)P片或B片中的宏塊在做幀內(nèi)預(yù)測(cè)時(shí)不使用相鄰的非幀內(nèi)編碼宏塊作為參考。

4、在H.323系統(tǒng)中實(shí)現(xiàn)H.264

　　由于H.264是一種新的視頻編解碼標(biāo)準(zhǔn)，與以往標(biāo)準(zhǔn)在體系結(jié)構(gòu)等方面有諸多差異，在H.323體系中應(yīng)用H.264存在一些問題，比如如何在H.245能力協(xié)商過程中正確協(xié)商端點(diǎn)之間的H.264能力和參數(shù)，因此必須對(duì)H.323標(biāo)準(zhǔn)的進(jìn)行必要補(bǔ)充和修改。為此，ITU-T制定了H.241標(biāo)準(zhǔn)。H.241標(biāo)準(zhǔn)定義了如何在原有的H.300系列終端間應(yīng)用H.264視頻編解碼標(biāo)準(zhǔn)進(jìn)行通信，廢除了一一些不再適合H.264使用的信令，重新定義了一些擴(kuò)展信令來支持H.264。本文僅介紹與H.323相關(guān)的修改。

　　(1)如何在H.245能力協(xié)商過程中協(xié)商H.264能力。H.264能力集是一個(gè)包含一個(gè)或多個(gè)H.264能力的列表，每一個(gè)H.264能力都包含Profile和Level兩個(gè)必選參數(shù)和CustomMaxMBPS，CustomMaxFS等幾個(gè)可選參數(shù)。在H.264中，Profile用于定義生成比特流的編碼工具和算法，Level則定義一些關(guān)鍵的參數(shù)。H.264能力包含在GenericCapability結(jié)構(gòu)中，其中CapabilityIdentifier的類型為standard，值為0.O.8.241.O.O.1，用于標(biāo)識(shí)H.241能力。MaxBitRate用于定義最大比特率。Collapsing字段包含H.264能力參數(shù)。

Profile，ParameterIdentifier類型為standard，值為41，用于標(biāo)識(shí)Profile，ParameterValue類型為booleanAr-ray，其值標(biāo)識(shí)Profile值，可以為64，32，16，分別表示Baseline，Main和Extended三個(gè)Profile；

Level，ParameterIdentifier類型為standard，值為42，用于標(biāo)識(shí)Level，ParameterValue類型為unsignedMin，其值標(biāo)識(shí)對(duì)應(yīng)15個(gè)可選的Level值。

　　其他的幾個(gè)參數(shù)作為可選項(xiàng)出現(xiàn)。

　　(2)由于H.264中圖像的組織結(jié)構(gòu)與傳統(tǒng)的標(biāo)準(zhǔn)不同，一些原有的H.245信令不在適用于H.264(如Miscella-neousCommand中的videoFastUpdateGOB，videoSendSync EveryGOB等)，因此H.241重新定義了幾個(gè)信令。

　　(3)H.264的RTP封裝格式參考RFC3550，載荷類型(PT)域未作規(guī)定。

5、結(jié)束語

　　作為一種新的國際標(biāo)準(zhǔn)，H.264標(biāo)志著在視頻編碼技術(shù)上的不斷進(jìn)步，它在編碼效率、圖像質(zhì)量、網(wǎng)絡(luò)親和性和抗誤碼方面都取得了成功。但隨著終端和網(wǎng)絡(luò)的快速發(fā)展，對(duì)視頻編解碼的新要求在不斷出現(xiàn)，H.264也仍在繼續(xù)完善和發(fā)展。目前，對(duì)H.264的研究主要集中在如何進(jìn)一步優(yōu)化算法結(jié)構(gòu)、降低處理時(shí)延、提高實(shí)時(shí)性和進(jìn)一步提高圖像質(zhì)量上。目前，很多廠家都推出了使用H.264進(jìn)行編解碼的視頻會(huì)議系統(tǒng)，大多數(shù)做到了在Baseline Profile上的互通。試驗(yàn)證明，H.264的圖像質(zhì)量較以往標(biāo)準(zhǔn)確實(shí)有很大的提高，尤其是在低碼率的情況下。隨著H.264自身的不斷完善和視頻通信的不斷普及，相信H.264的應(yīng)用將越來越廣泛。

泰爾網(wǎng)

相關(guān)鏈接:

國外IPTV如火如荼與國內(nèi)雷大雨小的反思 2005-03-25

電視與網(wǎng)絡(luò)優(yōu)勢(shì)互補(bǔ)的最佳傳媒結(jié)合體 2005-03-25

3G基礎(chǔ)知識(shí)及3G/視頻產(chǎn)品應(yīng)用 2005-03-24

移動(dòng)視頻發(fā)展的誤區(qū) 2005-03-21

視訊技術(shù)與視訊業(yè)務(wù)分析 2005-03-04

分類信息: 文摘技術(shù)_視像通訊_文摘