壓縮編碼標(biāo)準(zhǔn)是數(shù)字視頻產(chǎn)業(yè)發(fā)展的基石和標(biāo)尺。數(shù)字編解碼標(biāo)準(zhǔn)采用的基本方法幾乎都是基于塊的混合編碼框架,混合編碼框架的技術(shù)方式主要包括基于DCT變換編碼運(yùn)動補(bǔ)償?shù)念A(yù)測編碼和熵編碼,這是現(xiàn)代視頻編碼的關(guān)鍵技術(shù)。所謂”基于塊”,指的是首先將一幅圖像分成矩形的像素塊,作為編碼處理的基本單元!盎旌稀敝傅氖窍龝r間冗余的運(yùn)動估計(jì)與消除空間冗余的變換編碼的結(jié)合。在理想情況下, -方面為了充分利用像素之間的空間相關(guān)性,變換應(yīng)該應(yīng)用于整幅圖像或視頻幀;另一方面,如果以單個像素為單位進(jìn)行運(yùn)動估計(jì),就能夠精確地消除時間冗余。但是以上兩種方式的計(jì)算復(fù)雜度都相當(dāng)高,且要求兩者是互相矛盾的。因此,通常采用適當(dāng)大小的矩形像素塊作為變換編碼和運(yùn)動估計(jì)的基本單位,以平衡編碼效率和計(jì)算復(fù)雜度兩方面的矛盾。
數(shù)字視頻編碼是減少數(shù)據(jù)冗余的過程。雖然用于表示數(shù)字視頻的數(shù)據(jù)量很大,但數(shù)據(jù)之間往往保持高度的相關(guān)性,這些相關(guān)性表現(xiàn)出數(shù)據(jù)的冗余。視頻壓縮編碼就是采用一定的方式減少數(shù)據(jù)之間的相關(guān)性,盡可能消除冗余,使數(shù)據(jù)最有效地表示信息。通常的數(shù)據(jù)冗余存在于三個方面,即空間、時間和心理視覺冗余。
空間冗余產(chǎn)生的原因在于視頻序列都是由一幀一幀的圖像序列組成的,對于每幀圖像,前景物體和背景都有很大的相關(guān)性。據(jù)統(tǒng)計(jì),圖像內(nèi)的每個像素都與其距離小于16個像素點(diǎn)的像素相關(guān)。
時間冗余存在的原因在于視頻序列在時間上的相關(guān)性,視頻幀在時間上呈現(xiàn)的是一種近似連續(xù)的變化;在動態(tài)視頻序列中,前一幀圖像和后一幀圖像有很大的相關(guān)性,因此形成時間上的數(shù)據(jù)冗余。在一定的時間間隔內(nèi),視頻序列中的背景往往都相同,前景物體只是有微小的變化,即平移、旋轉(zhuǎn)或拉伸等,所以相鄰的兩幀或幾幀之間有許多相同或相近的地方,沒有必要在每幀中都把這些數(shù)據(jù)信息表示出來。
心理視覺冗余是由于人類視覺系統(tǒng)對圖像的變化感知產(chǎn)生的,人的視覺系統(tǒng)是非均勻和非線性的,并不是圖像的所有變化都能感知。而且,人眼對圖像的亮度和色度的敏感度相差很大,對亮度的敏感度遠(yuǎn)大于對色度的敏感度。心理視覺冗余就是利用人的錯覺來壓縮數(shù)據(jù)量。數(shù)字視頻編碼可通過變換編碼和預(yù)測編碼達(dá)到消除冗余的目的,并以較小的帶寬傳輸盡量多的有效數(shù)據(jù)。
在制定數(shù)字音視頻壓縮編碼標(biāo)準(zhǔn)的過程中,聯(lián)合圖像專家組(Joint Photographic Experts Group, JPEG)、動態(tài)圖像專家組(Moving Pictures Experts Group, MPEG)和視頻編碼專家組(Video Coding ExpertGroup, VCEG)發(fā)揮了至關(guān)重要的推動作用。