1、什么是H.261編碼協議
答:H.261是早出現的視頻編碼協議,它采用的算法結合了可減少時間冗余的幀間預測和可減少空間冗余的DCT變換的混合編碼方法,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合于面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。該標準主要針對ISDN電話線的視頻會議,可視電話等,ISDN的基本速率為64kbps,可以使用多路復用(p×64kbps)。
2、什么是H.263編碼協議?
答:1996年3月ITU-T制定的H.263標準是一種用于低比特率視頻業務中運動圖像部分的壓縮編碼方法。視頻編碼算法的基本思想是基于ITU-T的H.261標準,把減少空間冗余的幀內預測法和減少時間冗余的變換編碼法結合起來。編碼器有運動補償能力,并有一些功能、編碼方法選項。與采用全象素精度和一個環形濾波器的H.261標準的運動補償比較,H.263標準采用了半象素精度位移估值。除了基本的視頻源編碼算法外,為了改善性能,它包含4個可選的編碼方案:非限制運動矢量,先進預測模式,PB幀模式和基于語法的算術編碼。H.263是對原有標準的修訂和改進,包括圖像格式、總開銷和減少方塊效應等。盡管這些選項使編碼器復雜,但能顯著改善圖像的質量。
為了提高編碼效率,1997年9月ITU-T又制定了H.263+(H.263的第二版)標準,它是兼容H.263的。H.263+能更好的提高恢復圖像的質量和壓縮性能,有廣闊的應用前景。H.263+在H.263的基礎上實施了許多改進,它允許使用更多的圖像格式、圖像形狀和時鐘頻率。這就增加了H.263+應用的靈活性。另外,圖像大小、形狀和時鐘頻率可以在H.263+的比特流中給出。H.263+在H.263的基礎上的另一個重要改進是采用可放縮性,它能提高視頻信息在易出錯、數據丟失或不同環境中的傳輸正確率,進一步限制圖像。
3、什么是H.264(MPEG-4 Part 10) 編碼協議?其技術亮點是什么?
答: H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標準,它既是ITU-T的H.264(MPEG-4 Part 10) ,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案征集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264(MPEG-4 Part 10) 的FCD板。
H.264(MPEG-4 Part 10) 和以前的標準一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,采用“網絡友好”的結構和語法,有利于對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264(MPEG-4 Part 10) 標準中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基于4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264(MPEG-4 Part 10) 算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264(MPEG-4 Part 10) 的碼流結構網絡適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網絡的應用。
技術亮點:
(1)分層設計
H.264(MPEG-4 Part 10) 的算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網絡提取層(NAL:Network Abstraction Layer)負責以網絡所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基于分組方式的接口,打包和相應的信令屬于NAL的一部分。這樣,高編碼效率和網絡友好性的任務分別由VCL和NAL來完成。
(2)高精度、多模式運動估計
H.264(MPEG-4 Part 10) 支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻噪聲,對于1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇“增強”內插濾波器來提高預測的效果。
(3)4×4塊的整數變換
H.264(MPEG-4 Part 10) 與先前的標準相似,對殘差采用基于塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在于:在編碼器中和解碼器中允許精度相同的變換和反變換,便于使用簡單的定點運算方式。也就是說,這里沒有“變換誤差”。變換的單位是4×4塊,而不是以往常用的8×8塊。由于用于變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。
(4)統一的VLC
H.264(MPEG-4 Part 10) 中熵編碼有兩種方法,一種是對所有的待編碼的符號采用統一的VLC(UVLC :Universal VLC),另一種是采用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
(5)幀內預測
在先前的H.26x系列和MPEG-x系列標準中,都是采用的幀間預測的方式。在H.264(MPEG-4 Part 10) 中,當編碼Intra圖像時可用幀內預測。對于每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼算法,可以除去相鄰塊之間的空間冗余度,取得更為有效的壓縮。
(6)面向IP和無線環境
H.264(MPEG-4 Part 10) 草案中包含了用于差錯消除的工具,便于壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。