影片編碼中幀內預測的發展

浪矢-CL發表於2024-06-16

目錄
  • 為什麼使用幀內預測?
  • h.264/AVC
  • h.265/HEVC
  • VVC

為什麼使用幀內預測?

\(\quad\) 幀內預測是一種較為簡單和實用的影像壓縮編碼方法。預測壓縮編碼後傳輸的並不是畫素值本身,而是編碼畫素的預測值和真實值之差,即預測誤差或殘差。
\(\quad\) 這是因為大量統計結果表明,同一幅影像的鄰近畫素之間有著很強的相關性,或者說這些畫素值很相近,鄰近畫素值之間發生突變的機率很小。這樣,編碼畫素的預測值往往和它的真實的畫素值相差無幾,預測誤差很多為0或很小,我們就可以用較少的位元來表示和傳輸。
DCT變換之後使用幀內預測?

最佳模式選擇由此而成為幀內預測編碼中的一個重要問題。選擇最佳預測模式的方法有很多種,其中率失真最佳化(RDO)方法是一種效能良好的選擇方法,其原則是選擇能獲得最準確預測、產生碼字最少的那種預測模式。

h.264/AVC

H.264/AVC中首次提出,幀內預測編碼。對當前塊的預測是基於鄰近已編碼重建的塊進行的。

  • 對亮度畫素而言,獨立進行預測的塊可以是16×16宏塊或4×4子塊。
    4×4的亮度子塊有9種可選的預測模式,適於對具有大量細節的影像進行預測;16×16的亮度塊有4種預測模式,適於對具有平坦區域的影像進行預測。
  • 和16×16亮度宏塊對應的色度塊尺寸為8×8,也有4種預測模式,類似於16×16亮度塊預測模式。一個子塊或宏塊將面臨多種預測模式的選擇,不同的模式選擇將產生不同的壓縮率。

h.265/HEVC

\(\quad\) HEVC的編碼框架:沿用H.264/AVC的混合編碼框架,用幀間和幀內預測編碼來消除時間域和空間域的冗餘度,對殘差進行變換編碼來消除變換域的冗餘度。
\(\quad\) HEVC的技術創新:靈活的影像四叉樹(Quadtree)結構,,利於平行計算的波前技術以及基於上下文的算術編碼技術。

  • 亮度分量的分塊包括 4x4, 8x8, 16x16, 32x32, 64x64 每一種大小的PU都有35種預測模式:
    Planar模式DC模式以及33種角度模式。

VVC

VVC中,幀內預測模式從HEVC的33種擴充套件到65種角度預測模式,加上DC(直流平均)和Planar(平面加權平均)模式,共67個預測模式。

相關文章