H.264與MPEG-4對(duì)比
在極低碼率(32-128Kbps)的情況下,H.264與MPEG-4相比具有性能倍增效應(yīng),即:相同碼率的H.26L媒體流和MPEG-4媒體流相比,H.26L擁有大約3個(gè)分貝的增益(畫(huà)質(zhì)水平倍增)。32Kbps的H.26L媒體流,其信躁比與128K的MPEG-4媒體流相近。即在同樣的畫(huà)面質(zhì)量下,H.264的碼率僅僅為MPEG-4的四分之一。
H.264/AVC核心技術(shù)概覽
這個(gè)新的標(biāo)準(zhǔn)是由下面幾個(gè)處理步驟組成的:
幀間和幀內(nèi)預(yù)測(cè)
變換(和反變換)
量化(和反量化)
環(huán)路濾波
熵編碼
單張的圖片流組成了視頻,它能分成16X16像素的"宏塊",這種分塊方法簡(jiǎn)化了在視頻壓縮算法中每個(gè)步驟的處理過(guò)程。舉例來(lái)說(shuō),從標(biāo)準(zhǔn)清晰度標(biāo)準(zhǔn)視頻流解決方案(720X480)中截取的一幅圖片被分成1350(45X30)個(gè)宏塊,然后在宏塊的層次進(jìn)行進(jìn)一步的處理。
幀間預(yù)測(cè)
改良的運(yùn)動(dòng)估計(jì)。運(yùn)動(dòng)估計(jì)用來(lái)確定和消除存在于視頻流中不同圖片之間的時(shí)間冗余。當(dāng)運(yùn)動(dòng)估計(jì)搜索是根據(jù)過(guò)去方向的圖片,那么被編碼的圖片稱(chēng)為"P幀圖片",當(dāng)搜索是根據(jù)過(guò)去和將來(lái)兩種方向的圖片,那么被編碼的圖片被稱(chēng)為"B幀圖片"。
為了提高編碼效率,為了包含和分離在"H.264運(yùn)動(dòng)估計(jì)-改良的運(yùn)動(dòng)估計(jì)"圖中的運(yùn)動(dòng)宏塊,宏塊被拆分成更小的塊。然后,以前或?qū)?lái)的圖片的運(yùn)動(dòng)矢量被用來(lái)預(yù)測(cè)一個(gè)給定的塊。H.264/MPEG-4AVC發(fā)明了一種更小的塊,它具有更好的靈活性,在運(yùn)動(dòng)矢量方面可以有更高的預(yù)測(cè)精度。
H.264運(yùn)動(dòng)估計(jì)-改良的運(yùn)動(dòng)估計(jì)
幀內(nèi)預(yù)測(cè)
不能運(yùn)用運(yùn)動(dòng)估計(jì)的地方,就采用幀內(nèi)估計(jì)用來(lái)消除空間冗余。內(nèi)部估計(jì)通過(guò)在一個(gè)預(yù)定義好的集合中不同方向上的鄰近塊推測(cè)相鄰像素來(lái)預(yù)測(cè)當(dāng)前塊。然后預(yù)測(cè)塊和真實(shí)塊之間的不同點(diǎn)被編碼。這種方法是H.264/MPEG-4AVC所特有的,尤其對(duì)于經(jīng)常存在空間冗余的平坦背景特別有用。一個(gè)例子就是下邊展示的"H.264內(nèi)部估計(jì)"。
H.264內(nèi)部估計(jì)
變換
運(yùn)動(dòng)估計(jì)和內(nèi)部估計(jì)后的結(jié)果通過(guò)變換被從空間域轉(zhuǎn)換到頻率域。H.264/MPEG-4AVC使用整數(shù)DCT4X4變換。而MPEG-2和MPEG-4使用浮點(diǎn)DCT8X8變換。更小塊的H.264/MPEG-4AVC減少了塊效應(yīng)和明顯的人工痕跡。整數(shù)系數(shù)消除了在MPEG-2和MPEG-4中進(jìn)行浮點(diǎn)系數(shù)
運(yùn)算時(shí)導(dǎo)致的精度損失。
H.264變換
量化
變換后的系數(shù)被量化,減少了整數(shù)系數(shù)的預(yù)測(cè)量和消除了不容易被感知高頻系數(shù)。這個(gè)步驟也用來(lái)控制輸出的比特率維持在一個(gè)基本恒定的常量。
H.264量化/碼率控制
環(huán)路濾波
H.264/MPEG-4AVC標(biāo)準(zhǔn)定義了一個(gè)對(duì)16X16宏塊和4X4塊邊界的解塊過(guò)濾過(guò)程。在宏塊這種情況下,過(guò)濾的目的是消除由于相鄰宏塊有不同的運(yùn)動(dòng)估計(jì)類(lèi)型(比如運(yùn)動(dòng)估計(jì)和內(nèi)部估計(jì))或者不同的量化參數(shù)導(dǎo)致的人工痕跡。在塊邊界
這種情況下,過(guò)濾的目的是消除可能由于變換/量化和來(lái)自于相鄰塊運(yùn)動(dòng)矢量的差別引起的人工痕跡。環(huán)路濾波通過(guò)一個(gè)內(nèi)容自適應(yīng)的非線(xiàn)性算法修改在宏塊/塊邊界的同一邊的兩個(gè)像素。
熵編碼
在熵編碼之前,4X4的量化系數(shù)必須被重排序。根據(jù)這些系數(shù)原來(lái)采用的預(yù)測(cè)算法為運(yùn)動(dòng)估計(jì)或者內(nèi)部估計(jì)的不同來(lái)選擇不同的掃描類(lèi)型創(chuàng)建一個(gè)重排序的串行化流。掃描類(lèi)型按照從低頻到高頻的順序排序這些系數(shù)。既然高頻系數(shù)大多數(shù)趨向于零,那么利用游程編碼就可以縮減零的數(shù)目,從而高效的達(dá)到熵編碼的目的。
H.264熵編碼-系數(shù)的串行化
在熵編碼步驟通過(guò)映射符號(hào)的字節(jié)流來(lái)表示運(yùn)動(dòng)矢量,量化系數(shù)和宏塊頭。熵編碼通過(guò)設(shè)計(jì)用一個(gè)較少的比特位數(shù)來(lái)表示頻繁使用的符號(hào),比較多的比特位數(shù)來(lái)表示不經(jīng)常使用的符號(hào)。
更多相關(guān): AV集成
©版權(quán)所有。未經(jīng)許可,不得轉(zhuǎn)載。