視頻壓縮編碼技術_常用的視頻壓縮標準是什麼啊

㈠常用的視頻壓縮標準是什麼啊

視頻壓縮標准如下：

1、H.261

H.261標準是為ISDN設計，主要針對實時編碼和解碼設計，壓縮和解壓縮的信號延時不超過150ms，碼率px64kbps(p=1~30）。

H.261標准主要採用運動補償的幀間預測、DCT變換、自適應量化、熵編碼等壓縮技術。只有I幀和P幀，沒有B幀，運動估計精度只精確到像素級。支持兩種圖像掃描格式：QCIF和CIF。

2、H.263

H.263標準是甚低碼率的圖像編碼國際標准，它一方面以H.261為基礎，以混合編碼為核心，其基本原理框圖和H.261十分相似，原始數據和碼流組織也相似；另一方面，H.263也吸收了MPEG等其它一些國際標准中有效、合理的部分，如：半像素精度的運動估計、PB幀預測等，使它性能優於H.261。

H.263使用的位率可小於64Kb/s，且傳輸比特率可不固定（變碼率）。H.263支持多種解析度：SQCIF(128x96）、 QCIF、CIF、4CIF、16CIF。

3、H.264/AVC

視頻壓縮國際標准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4，其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T與MPEG聯合制定。

從簡單來說H.264就是一種視頻編碼技術，與微軟的WMV9都屬於同一種技術也就是壓縮動態圖像數據的「編解碼器」程序。

一般來說，如果動態圖像數據未經壓縮就使用的話，數據量非常大，容易造成通信線路故障及數據存儲容量緊張。

因此，在發送動態圖像時、或者把影像內容保存在DVD上時、以及使用存儲介質容量較小的數碼相機或相機手機拍攝映像時，就必須使用編解碼器。雖然編解碼器有許多種類，但DVD-Video與微波數字電視等使用的主要是MPEG2，數碼相機等攝像時主要使用MPEG4。

既然作為壓縮視頻編碼技術，H.264最大的作用對視頻的壓縮了。我們熟悉的MPEG2也就是最常用的DVD視頻編碼技術已經比較落後。

MPEG-4

MPEG-4標准並非是MPEG-2的替代品，它著眼於不同的應用領域。MPEG-4的制定初衷主要針對視頻會議、可視電話超低比特率壓縮（小於64Kb/s）的需求。在制定過程中，MPEG組織深深感受到人們對媒體信息，特別是對視頻信息的需求由播放型轉向基於內容的訪問、檢索和操作。

MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同，它為多媒體數據壓縮編碼提供了更為廣闊的平台，它定義的是一種格式、一種框架，而不是具體演算法，它希望建立一種更自由的通信與開發環境。

於是MPEG-4新的目標就是定義為：支持多種多媒體的應用，特別是多媒體信息基於內容的檢索和訪問，可根據不同的應用需求，現場配置解碼器。編碼系統也是開放的，可隨時加入新的有效的演算法模塊。應用范圍包括實時視聽通信、多媒體通信、遠地監測/監視、VOD、家庭購物/娛樂等。

MPEG-4視頻壓縮演算法相對於MPEG-1/2在低比特率壓縮上有著顯著提高，在CIF（352*288）或者更高清晰度（768*576）情況下的視頻壓縮，無論從清晰度還是從存儲量上都比MPEG1具有更大的優勢，也更適合網路傳輸。另外MPEG-4可以方便地動態調整幀率、比特率，以降低存儲量。

MPEG-4由於系統設計過於復雜，使得MPEG-4難以完全實現並且兼容，很難在視頻會議、可視電話等領域實現，這一點有點偏離原來地初衷。

㈡視頻編碼的技術

監控中主要採用MJPEG、MPEG1/2、MPEG4(SP/ASP）、H.264/AVC、VC-1、RealVideo等幾種視頻編碼技術。對於最終用戶來言他最為關心的主要有：清晰度、存儲量（帶寬）、穩定性還有價格。採用不同的壓縮技術，將很大程度影響以上幾大要素。
MJPEG
MJPEG（Motion JPEG）壓縮技術，主要是基於靜態視頻壓縮發展起來的技術，它的主要特點是基本不考慮視頻流中不同幀之間的變化，只單獨對某一幀進行壓縮。
MJPEG壓縮技術可以獲取清晰度很高的視頻圖像，可以動態調整幀率、解析度。但由於沒有考慮到幀間變化，造成大量冗餘信息被重復存儲，因此單幀視頻的佔用空間較大，流行的MJPEG技術監控與視頻編碼最好的也只能做到3K位元組/幀，通常要8~20K！
MPEG-1/2
MPEG-1標准主要針對SIF標准解析度(NTSC制為352X240；PAL制為352X288）的圖像進行壓縮. 壓縮位率主要目標為1.5Mb/s.較MJPEG技術，MPEG1在實時壓縮、每幀數據量、處理速度上有顯著的提高。但MPEG1也有較多不利地方：存儲容量還是過大、清晰度不夠高和網路傳輸困難。
MPEG-2 在MPEG-1基礎上進行了擴充和提升，和MPEG-1向下兼容，主要針對存儲媒體、數字電視、高清晰等應用領域，解析度為：低（352x288），中（720x480），次高（1440x1080），高（1920x1080）。MPEG-2視頻相對MPEG-1提升了解析度，滿足了用戶高清晰的要求，但由於壓縮性能沒有多少提高，使得存儲容量還是太大，也不適合網路傳輸。
MPEG-4
MPEG-4視頻壓縮演算法相對於MPEG-1/2在低比特率壓縮上有著顯著提高，在CIF（352*288）或者更高清晰度（768*576）情況下的視頻壓縮，無論從清晰度還是從存儲量上都比MPEG1具有更大的優勢，也更適合網路傳輸。另外MPEG-4可以方便地動態調整幀率、比特率，以降低存儲量。
MPEG-4由於系統設計過於復雜，使得MPEG-4難以完全實現並且兼容，很難在視頻會議、可視電話等領域實現，這一點有點偏離原來地初衷。另外對於中國企業來說還要面臨高昂的專利費問題，規定：
－每台解碼設備需要交給MPEG-LA 0.25美元。
－編碼/解碼設備還需要按時間交費（4美分/天=1.2美元/月 =14.4美元/年）。
H.264/AVC
視頻壓縮國際標准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4，其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T與MPEG聯合制定。
從簡單來說H.264就是一種視頻編碼技術，與微軟的WMV9都屬於同一種技術也就是壓縮動態圖像數據的「編解碼器」程序。
一般來說，如果動態圖像數據未經壓縮就使用的話，數據量非常大，容易造成通信線路故障及數據存儲容量緊張。因此，在發送動態圖像時、或者把影像內容保存在DVD上時、以及使用存儲介質容量較小的數碼相機或相機手機拍攝映像時，就必須使用編解碼器。雖然編解碼器有許多種類，但DVD-Video與微波數字電視等使用的主要是MPEG2，數碼相機等攝像時主要使用MPEG4。
既然作為壓縮視頻編碼技術，H.264最大的作用對視頻的壓縮了。我們熟悉的MPEG2也就是最常用的DVD視頻編碼技術已經比較落後。
對於最希望看到的HDTV的節目如果播放時間在2小時左右的話，使用MPEG2最小隻能壓縮至30GB，而使用H.264、WMV9這樣的高壓縮率編解碼器，在畫質絲毫不降的前提下可壓縮到15GB以下。
上面的例子可以看出H.264的技術優勢了，一般來說H.264的數據壓縮率在MPEG2的2倍以上、MPEG4的1.5倍以上。從理論上來說，在相同畫質、相同容量的情況下，可比DVD光碟多保存2倍以上時間的影像。作為電影與音樂會等映像內容與便攜設備的編解碼器被廣泛使用。
大家是否都能記得當年的視頻解壓卡，也就是我們說的DVD/VCD解壓縮卡，這個東西的原理很簡單，就是板卡上安裝了DSP晶元，而這個晶元唯一的功能就是用來針對特殊格式的編碼進行解壓縮，當後來顯卡的性能逐漸增強可以滿足視頻播放需要的時候，視頻解壓縮卡也就消失的不見了。
而ATI的做法就是最新的R520 VPU內就包含了H.264解碼技術，這種特殊的演算法直接交給顯卡VPU來運算，而不是完全交給CPU處理，這樣就可以解放出CPU進行更多其他復雜的運算。
H.264集中了以往標準的優點，在許多領域都得到突破性進展，使得它獲得比以往標准好得多整體性能：
－和H.263+和MPEG-4 SP相比最多可節省50%的碼率，使存儲容量大大降低；
－ H.264在不同解析度、不同碼率下都能提供較高的視頻質量；
－採用「網路友善」的結構和語法，使其更有利於網路傳輸。
H.264採用簡潔設計，使它比MPEG4更容易推廣，更容易在視頻會議、視頻電話中實現，更容易實現互連互通，可以簡便地和G.729等低比特率語音壓縮組成一個完整的系統。
MPEG LA吸收MPEG-4的高昂專利費而使它難以推廣的教訓，MPEG LA制定了以下低廉的H.264收費標准：H.264廣播時基本不收費；產品中嵌入H.264編/解碼器時，年產量10萬台以下不收取費，超過10萬台每台收取0.2美元，超過500萬台每台收取0.1美元。低廉的專利費使得中國H.264監控產品更容易走向世界。
H.264發展歷史
隨著NGN、3G及3G演進和NGBW等對視頻、多媒體業務與網路應用的飛速發展需求，作為視頻業務及存儲應用核心技術的高效率視頻數字壓縮編技術，愈來愈引起人們的關注，成為廣播、視頻與多媒體通信領域中的亮點與熱點，這其中H.264視頻編碼標准更是耳熟能詳的一個名字。
早在1993年，ITU-T（國際電信聯盟電信標准化部門）制定了第一個視頻編碼標准H.261，其輸出速率為p*64 kbit/s，主要用於ISDN及ATM等准寬頻及寬頻信道視頻。隨著時間的不斷發展，經歷了1996年的H.263，1998年的H.263+，2000年的H.263++，到了2001年，MPEG認識到H.26L的潛在優勢及與VCEG聯合工作的必要性，從而兩者合作成立聯合視頻組（JVT），從而形成了2003年第二季度發布的統一標准H.264/AVC。該標准在ITU-T稱為H.264；在ISO/IEC則稱為MPEG4-Part 10 AVC（Advanced Video Coding，第10部分，先進視頻編碼），這也就是今天我們大家都津津樂道的H.264/AVC。
與先前的一些編碼標准相比，H.264標准繼承了H.263和MPEG1/2/4視頻標准協議的優點，但在結構上並沒有變化，只是在各個主要的功能模塊內部使用了一些先進的技術，提高了編碼效率。其主要表現在：編碼不再是基於8×8的塊進行，而是在4×4大小的塊上，進行殘差的變換編碼。所採用的變換編碼方式也不再是DCT變換，而是一種整數變換編碼。採用了編碼效率更高的上下文自適應二進制算術編碼（CABAC），同時與之相應的量化過程也有區別。H.264標准具有演算法簡單易於實現、運算精度高且不溢出、運算速度快、佔用內存小、消弱塊效應等優點，是一種更為實用有效的圖像編碼標准。
H.264/AVC在壓縮編碼效率、視頻內容自適性處理能力方面及網路層面，特別是對IP網路及移動網路的自適應處理能力、抗干擾能力與頑健性等方面，相比H.263/MPEG-4均有大幅度提高，也就造成了H.264被熱炒的局面。應該說，H.264/AVC的應用確屬相當廣泛，包括固定或移動的可視電話、行動電話、實時視頻會議、視頻監控、流媒體、多媒體視頻、Internet視頻及多媒體、IPTV、手機電視、寬頻電話以及視頻信息存儲等，這也是業內普遍看好它的重要原因。

㈢視頻相關的理論知識與基礎概念

本文將視頻相關的理論知識與基礎概念劃分為 11 個知識點，如下：

根據人眼視覺暫留原理，每秒超過 24 幀的圖像變化看上去是平滑連續的，這樣的連續畫面叫視頻。

解析度是以橫向和縱向的像素數量來衡量的，表示平面圖像的精細程度。視頻精細程度並不只取決於視頻解析度，還取決於屏幕解析度。
1080P 的 P 指 Progressive scan（逐行掃描），即垂直方向像素點，也就是 "高"，所以 1920X1080 叫 1080P，不叫 1920P。
當 720P 的視頻在 1080P 屏幕上播放時，需要將圖像放大，放大操作也叫上采樣。
上采樣幾乎都是採用內插值方法，即在原有圖像的像素點之間採用合適的插值演算法插入新的元素，所以圖像放大也稱為圖像插值。
簡單的記錄一下插值演算法：

（1）鄰插值演算法：
將四個像素（放大一倍）用原圖一個像素的顏色填充，較簡單易實現，早期的時候應用比較普遍，但會產生明顯的鋸齒邊緣和馬賽克現象。
（2）雙線性插值法：
是對鄰插值法的一種改進，先對兩水平方向進行一階線性插值，再在垂直方向上進行一階線性插值。能有效地彌補鄰插值演算法的不足，但還存在鋸齒現象並會導致一些不期望的細節柔化。
（3）雙三次插值法：
是對雙線性插值法的改進，它不僅考慮到周圍四個直接相鄰像素點灰度值的影響，還考慮到它們灰度值變化率的影響，使插值生成的像素灰度值延續原圖像灰度變化的連續性，從而使放大圖像濃淡變化自然平滑。

除此之外還有很多更復雜效果更優的演算法，比如小波插值、分形等等。

當 1080P 的視頻在 720P 屏幕上播放時，需要將圖像縮小，縮小操作也叫下采樣。

下采樣的定義為：對於一個樣值序列，間隔幾個樣值取樣一次，得到新序列。
對於一幅解析度為 M N 的圖像，對其進行 s 倍下采樣，即得到 (M/s) (N/s) 解析度的圖像（s 應為 M、N 的公約數），就是把原始圖像 s*s 窗口內的圖像變成一個像素，這個像素點的值就是窗口內所有像素的均值。

最佳體驗為屏幕與視頻解析度相同且全屏播放，視頻解析度過高的話屏幕沒有能力去呈現，視頻解析度過低的話無法發揮屏幕的能力。

比特率即碼率，在不同領域有不同的含義，在多媒體領域，指單位時間播放音頻或視頻的比特數，可以理解成吞吐量或帶寬。

單位為 bps , 即 bits per second，每秒傳輸的數據量，常用單位有：kbps、mbps 等。

計算公式：碼率（kbps）= 文件大小（kb）/ 時長（s）
通俗一點理解就是取樣率，取樣率越大，精度就越高，圖像質量越好，但數據量也越大，所以要找到一個平衡點：用最低的比特率達到最少的失真。
在一個視頻中，不同時段畫面的復雜程度是不同的，比如高速變化的場景和幾乎靜止的場景，所需的數據量也是不同的，若都使用同一種比特率是不太合理的，所以引入了動態比特率。

（1）動態比特率
簡稱為 VBR，即 Variable Bit Rate，比特率可以隨著圖像復雜程度的不同而隨之變化。
圖像內容簡單的片段採用較小的碼率，圖像內容復雜的片段採用較大的碼率，這樣既保證了播放質量，又兼顧了數據量的限制。
比如 RMVB 視頻文件，其中的 VB 就是指 VBR，表示採用動態比特率編碼方式，達到播放質量與體積兼得的效果。

（2）靜態比特率
簡稱為 CBR，即 Constant Bit Rate，比特率恆定。
圖像內容復雜的片段質量不穩定，圖像內容簡單的片段質量較好。
上面列出的計算公式顯然是針對 CBR ，除 VBR 和 CBR 外，還有 CVBR（Constrained VariableBit Rate）、ABR (Average Bit Rate) 等等。

定義：每秒從連續信號中提取並組成離散信號的采樣個數，單位為赫茲（Hz）。
對於取樣率、采樣率和抽樣率，沒必要糾結它們的區別，都是同義詞。
（1）音頻中的采樣率
指把音頻信號數字化後 1 個通道 1 秒鍾採取多少個樣本，如 44.1kHz 的采樣率，就是指 1 個通道 1 秒鍾有 44.1k 個數據。
（2）視頻中的采樣率
視頻一般不標識采樣率屬性，比如：

采樣率本身就是一個可泛化的概念，對於視頻來說，若非要用采樣率來描述的話，那就要分為兩個層面：幀頻和場頻。
從幀頻層面來說，采樣率就是指幀率，指 1 秒鍾顯示多少幀圖像。
從場頻層面來說，采樣率就是指像素頻率，指 1 秒鍾顯示多少個像素。
像素頻率是顯示器的一個指標，可以理解成顯示器的最大帶寬，可以起到限制解析度和刷新率的作用，根據含義可得出一個公式：
像素頻率 = 幀率 X 幀像素數量
對於：

定義：用於測量顯示幀數的量度。單位為 FPS（Frames per Second，每秒顯示幀數）或赫茲（Hz）。
幀率越高，畫面越流暢、逼真，對顯卡的處理能力要求越高，數據量越大。
1 中提到每秒超過 24 幀的圖像變化看上去是平滑連續的，這是針對電影等視頻而言，對游戲來說 24 幀是不流暢的。
為什麼 24fps 的電影感覺流暢，而 24fps 的游戲就感覺很卡呢？
第一個原因：兩者圖像生成原理不同
電影的一幀在一段時間曝光，每一幀都包含一段時間的信息，而游戲的畫面則是由顯卡計算生成的，一幀只包含那一瞬間的信息。
比如一個圓從左上角移動到右下角：

前者為電影的一幀，後者為游戲的一幀，可以看到在電影中動作會出現拖影，給人以動感的效果，連貫而不卡。
第二個原因：電影的FPS是穩定的，而游戲則是不穩定的
電影若為 24fps，那就表示每隔 1/24 秒刷新一次畫面，幀間隔是固定的。
游戲若為 60fps，表示大約每隔 1/60 秒刷新一次畫面，幀間隔是不穩定的，即使 1 秒能顯示 60 幀，那也可能是前半秒顯示了 59 幀，後半秒顯示了 1 幀。

定義：通過特定的壓縮技術，將某個視頻格式的文件轉換成另一種視頻格式。
視頻數據在時域和空域層面都有極強的相關性，這也表示有大量的時域冗餘信息和空域冗餘信息，壓縮技術就是去掉數據中的冗餘信息。

（1）去除時域冗餘信息
運動補償：通過先前的局部圖像來預測、補償當前的局部圖像，可有效減少幀序列冗餘信息。
運動表示：不同區域的圖像使用不同的運動矢量來描述運動信息，運動矢量通過熵編碼進行壓縮（熵編碼在編碼過程中不會丟失信息）。
運動估計：從視頻序列中抽取運動信息。
通用的壓縮標准使用基於塊的運動估計和運動補償。

（2）去除空域冗餘信息
變換編碼：將空域信號變換到另一正交矢量空間，使其相關性下降，數據冗餘度減小。
量化編碼：對變換編碼產生的變換系數進行量化，控制編碼器的輸出位率。
熵編碼：對變換、量化後得到的系數和運動信息，進行進一步的無損壓縮。
視頻壓縮編碼技術可分為兩大類：無損壓縮和有損壓縮。
（1）無損壓縮
無損壓縮也稱為可逆編碼，重構後的數據與原數據完全相同，適用於磁碟文件的壓縮等。
主要採用熵編碼方式，包括香農編碼、哈夫曼編碼和算術編碼等。
<1>香農編碼
香農編碼採用信源符號的累計概率分布函數來分配碼字，效率不高，實用性不大，但對其他編碼方法有很好的理論指導意義。
<2>哈夫曼編碼
哈夫曼編碼完全依據出現概率來構造異字頭的平均長度最短的碼字。
基本方法為：先對圖像數據掃描一遍，計算出各種像素出現的概率，按概率的大小指定不同長度的唯一碼字，由此得到一張該圖像的霍夫曼碼表。
編碼後的圖像數據記錄的是每個像素的碼字，而碼字與實際像素值的對應關系記錄在碼表中。
<3>算術編碼
算術編碼是用符號的概率和編碼間隔兩個基本參數來描述的，在給定符號集和符號概率的情況下，算術編碼可以給出接近最優的編碼結果。
使用算術編碼的壓縮演算法通常先要對輸入符號的概率進行估計，然後再編碼，估計越准，編碼結果就越接近最優的結果。
（2）有損壓縮
有損壓縮也稱為不可逆編碼，重構後的數據與原數據有差異，適用於任何允許有失真的場景，例如視頻會議、可視電話、視頻廣播、視頻監控等。
編碼方式包括預測編碼、變換編碼、量化編碼、混合編碼等。

定義：為保證編碼的正確性，編碼要規范化、標准化，所以就有了編碼標准。
研製視頻編碼標準的有兩大正式組織：ISO/IEC（國際標准化組織）、ITU-T（國際電信聯盟通信標准部）。
ISO/IEC 制定的編碼標准有：MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21 和 MPEG-H 等。
ITU-T 制定的編碼標准有：H.261、H.262、H.263、H.264 和 H.265 等。
MPEG-x 和 H.26x 標準的視頻編碼都是採用有損壓縮的混合編碼方式，主要區別在於處理圖像的解析度、預測精度、搜索范圍、量化步長等參數的不同，所以其應用場合也不同。
MPEG-x 系列：
（1）MPEG-1
MPEG-1 共 5 部分。
第 2 部分視頻編碼方案，規定了逐行掃描視頻的編碼方案。
第 3 部分音頻編碼方案，將音頻流的壓縮分為 3 層並依次增大壓縮比，廣為流傳的 MP3（MPEG-1 Layer 3）就是按照此部分編碼方案壓縮之後的文件格式。
（2）MPEG-2
MPEG-2 共 11 個部分，在 MPEG-1 的基礎上提高了碼率和質量。
第 2 部分視頻編碼方案，規定了隔行掃描視頻的編碼方案，是和 ITU-T 共同開發的，ITU-T 稱其為 H.262。
第 3 部分音頻編碼方案，延續了 MPEG-1 的 3 層壓縮方案，壓縮後文件格式仍未 MP3，但在壓縮演算法上有所改進。
第 7 部分首次提出 AAC（MPEG Advanced Audio Coding）編碼，目的以更小的容量和更好的音質取代 MP3 格式。
（3）MPEG-4
MPEG-4 共 27 個部分，更加註重多媒體系統的交互性和靈活性。
第 3 部分音頻編碼方案，優化了 AAC 編碼演算法，並在推出後逐漸取代 MP3，比如和視頻封裝在一起的音頻優先考慮 AAC 格式，但就民用而言大部分還是使用 MP3 格式。
第 10 部分提出 AVC（Advanced Video Coding）編碼，是和 ITU-T 共同開發的，ITU-T 稱其為 H.264。
第 14 部分提出了 MP4 格式封裝，官方文件後綴名是 ".mp4"，還有其他的以 mp4 為基礎進行的擴展或縮水版本的格式，包括：M4V, 3GP, F4V 等。
（4）MPEG-7
MPEG-7 不同於 MPEG-1、MPEG-2、MPEG-4，它不是音視頻壓縮標准。
MPEG-7 被稱為 "多媒體內容描述介面"，目的就是產生一種描述多媒體信息的標准，並將該描述與所描述的內容相聯系，以實現快速有效的檢索。
（5）MPEG-12
MPEG-12 其實就是一些關鍵技術的集成，通過這種集成環境對全球數字媒體資源進行管理，實現內容描述、創建、發布、使用、識別、收費管理、版權保護等功能。
（6）MPEG-H
MPEG-H 包含了 1 個數字容器標准、1 個視頻壓縮標准、1 個音頻壓縮標准和 2 個一致性測試標准。
其中視頻壓縮標准為高效率視頻編碼（HEVC），和 ITU-T 聯合開發，相比 H.264/MPEG-4 AVC 數據壓縮率增加了 1 倍。
H.26x 系列：
（1）H.261
H.261 是第一個實用的數字視頻編碼標准，使用了混合編碼框架，包括了基於運動補償的幀間預測，基於離散餘弦變換的空域變換編碼，量化，zig-zag 掃描和熵編碼。
H.261 的設計相當成功，之後的視頻編碼國際標准基本上都是基於 H.261 的設計框架，包括 MPEG-1，MPEG-2／H.262，H.263，甚至 H.264。
（2）H.262
H.262 由 MPEG-1 擴充而來，支持隔行掃描，在技術內容上和 MPEG-2 視頻標准一致，DVD 就是採用了該技術。
（3）H.263
H.263 是一種用於視頻會議的低碼率視頻編碼標准，在 H.261 基礎上發展而來。
與 H.261 相比採用了半象素的運動補償，並增加了 4 種有效的壓縮編碼模式，在低碼率下能夠提供比 H.261 更好的圖像效果。
H.263 於 1995 年推出第一版，後續在 1998 年和 2000 年還推出了第二版 H.263+、第三版 H.263++ 。
（4）H.264
H.264 又稱為 MPEG-4 第 10 部分，即 MPEG-4 AVC，它是一種面向塊，基於運動補償的視頻編碼標准。
於 2003 年正式發布，現在已經成為高精度視頻錄制、壓縮和發布的最常用格式之一。
H.264 可以在低碼率情況下提供高質量的視頻圖像，相比 H.263 可節省 50% 的碼率。
相比 H.263，H.264 不需設置較多的編碼選項，降低了編碼的復雜度。
H.264 可以根據不同的環境使用不同的傳輸和播放速率，並且提供了豐富的錯誤處理工具，可以很好的控制或消除丟包和誤碼。
H.264 性能的改進是以增加復雜性為代價而獲得的，H.264 編碼的計算復雜度大約相當於 H.263 的 3 倍，解碼復雜度大約相當於 H.263 的 2 倍。
H.264 協議中定義了三種幀，分別為 I 幀、P 幀以及 B 幀。
<1>I 幀
I幀即幀內編碼幀、關鍵幀，可以理解為一幀畫面的完整保留，解碼時只需要本幀數據就可以完成，不需要參考其他畫面，數據量比較大。
<2>P 幀
P幀即前向預測編碼幀，記錄當前幀跟上一關鍵幀（或P幀）的差別，解碼時依賴之前緩存的畫面，疊加上本幀定義的差別，才能生成最終畫面，數據量較 I 幀小很多。
<3>B 幀
B幀即雙向預測編碼幀，記錄當前幀跟前後幀的差別，解碼時依賴前面的I幀（或P幀）和後面的P幀，數據量比I幀和P幀小很多。
數據壓縮比大約為： I幀：P幀：B幀 = 7：20：50，可見 P 幀和 B 幀極大的節省了數據量，節省出來的空間可以用來多保存一些 I 幀，以實現在相同碼率下，提供更好的畫質。
（5）H.265
H.265 即高效視頻編碼（High Efficiency Video Coding ，簡稱 HEVC），於 2013 年正式推出。
H.265 編碼架構和 H.264 相似，主要也包含，幀內預測、幀間預測、轉換、量化、去區塊濾波器、熵編碼等模塊。
H.265 編碼架構整體被分為編碼單位、預測單位和轉換單位。
H.265 在 H.264 的基礎之上，使用先進的技術用以改善碼流、編碼質量、延時和演算法復雜度之間的關系，達到最優化設置。
在碼率減少 51-74% 的情況下，H.265 編碼視頻的質量還能與 H.264 編碼視頻近似甚至更好。
H.265 可以在有限帶寬下傳輸更高質量的網路視頻，智能手機、平板機等移動設備將能直接在線播放 1080p 的全高清視頻，讓網路視頻跟上了顯示屏「高解析度化」的腳步。
來張圖感受一下吧：

除 MPEG-x 和 H.26x 系列標准外，還有其他的編碼標准，如谷歌的 VP 系列，對視頻編碼標准歸納一下，如圖：

視頻封裝格式如 mp4、mkv，用來存儲或傳輸編碼數據，可以理解成一個容器。

封裝就是按照一定規則把音視頻、字幕等數據組織起來，包含編碼類型等公共信息，播放器可以按照這些信息來匹配解碼器、同步音視頻。

不同的封裝格式支持的視音頻編碼格式是不一樣的，比如 MKV 格式支持比較多，RMVB 則主要支持 Real 公司的視音頻編碼格式。

這里列出了常見的視頻封裝格式，可以查看各封裝格式支持的音視頻編碼格式等信息。

定義：將視頻壓縮編碼過的數據，解壓縮成為視頻原始數據，即視頻編碼的反過程。

對於一個播放器來說，很重要的一個指標就是能支持多少種視頻解碼。

播放一個本地視頻文件，需要經過解封裝，解碼音視頻，音視頻同步等步驟。

解封裝：就是將輸入的封裝格式的數據，分離成為音頻壓縮編碼數據和視頻壓縮編碼數據。例如，FLV 格式的數據，經過解封裝操作後，輸出 H.264 編碼的視頻碼流和 AAC 編碼的音頻碼流。
解碼：將視頻/音頻壓縮編碼數據，解碼成為非壓縮的視頻/音頻原始數據。音頻的壓縮編碼標准包含 AAC，MP3，AC-3 等等，視頻的壓縮編碼標准則包含 H.264，MPEG2，VC-1 等等。解碼是整個系統中最重要也是最復雜的一個環節。通過解碼，壓縮編碼的視頻數據輸出成為非壓縮的顏色數據，例如 YUV420P，RGB 等等；壓縮編碼的音頻數據輸出成為非壓縮的音頻抽樣數據，例如 PCM 數據。
視音頻同步：根據解封裝模塊處理過程中獲取到的參數信息，同步解碼出來的視頻和音頻數據，並將視頻音頻數據送至系統的顯卡和音效卡播放出來。

上面播放原理中分析的是本地視頻文件，如果播放的是互聯網上的視頻，步驟則為：解協議，解封裝，解碼音視頻，音視頻同步，多了一個解協議的步驟。
解協議：將流媒體協議的數據，解析為標準的相應的封裝格式數據。
視音頻在網路上傳播的時候，常常採用各種流媒體協議，例如 HTTP，RTMP， MMS 等等。這些協議在傳輸視音頻數據的同時，也會傳輸一些信令數據。
這些信令數據包括對播放的控制（播放，暫停，停止），或者對網路狀態的描述等。
解協議的過程中會去除掉信令數據而只保留視音頻數據。例如，採用 RTMP 協議傳輸的數據，經過解協議操作後，輸出 FLV 格式的數據。

㈣音視頻編碼格式認知

編碼格式對應的就是音頻編碼和視頻編碼，

音頻編碼標准和視頻編碼標准，每種編碼標准都對應的編碼演算法，其目的是通過一定編碼演算法實現數據的壓縮、減少數據的冗餘。

視頻編碼指的是通過特定的壓縮技術，將某個視頻文件格式轉換為另一種視頻格式文件的方式

可變碼率指的是輸出碼流的碼率是可變的，因為視頻信源本身的高峰信息量是變化的，從確保視頻傳輸質量和充分利用信息的角度來說，可變碼率視頻編碼才是最合理的。

相關資料免費分享，領取方式見下方騰訊文檔

C++音視頻開發學習資料：點擊領取音視頻開發（資料文檔+視頻教程+面試題）（FFmpeg+WebRTC+RTMP+RTSP+HLS+RTP）

是指視頻成像產品所形成的圖像大小或尺寸，常見的 1080P、4K 等又代表什麼呢，P 本身的含義是逐行掃描，表示視頻像素的總行數，

1080P 表示總共有 1080 行的像素數，而 K 表示視頻像素的總列數，4K 表示有 4000 列的像素數，

通常來說，1080P 就是指 1080 x 1920 的解析度，4 k 指 3840 x 2160 的解析度。

視頻編碼：

Xvid（舊稱為XviD）

是一個開放源代碼的MPEG-4影像編解碼器，是由一群原OpenDivX開發者在OpenDivX於2001年7月停止開發後自行開發的。

Xvid支持量化（Quantization）、范圍控制的運動偵測（Motion Search）、碼率曲線分配（Curve）、動態關鍵幀距（I-frame interval）、心理視覺亮度修正、演職員表選項、外部自定義控制、運動向量加速（Hinted ME）編碼、畫面優化解碼等眾多編碼技術，對用戶來說功能十分強大。

DivX是由MPEG-4衍生出的一種視頻編碼(壓縮)標准，也即我們通常所說的DVDrip格式，

它採用了MPEG4的壓縮演算法，同時又綜合了MPEG-4與MP3各方面的技術，說白了就是使用DivX壓縮技術對DVD碟片的視頻圖像進行高質量壓縮，

同時用MP3或AC3對音頻進行壓縮，然後再將視頻與音頻合成，並加上相應的外掛字幕文件而形成的視頻格式。其畫質直逼DVD，而體積只有DVD的數分之一。

XviD與DivX幾乎相同，是開源的DivX，不收費，而使用DivX要收費。

H.264是一種高性能的視頻編解碼技術。

目前國際上制定視頻編解碼技術的組織有兩個，一個是「國際電聯（ITU-T）」，它制定的標准有H.261、H.263、H.263+等，

另一個是「國際標准化組織（ISO）」它制定的標准有MPEG-1、MPEG-2、MPEG-4等。

而H.264則是由兩個組織聯合組建的聯合視頻組（JVT）共同制定的新數字視頻編碼標准，

所以它既是ITU-T的H.264，又是ISO/IEC的MPEG-4高級視頻編碼（Advanced Video Coding，AVC），而且它將成為MPEG-4標準的第10部分。

因此，不論是MPEG-4 AVC、MPEG-4 Part 10，還是ISO/IEC 14496-10，都是指H.264。

H.264最具價值的部分是更高的數據壓縮比，在同等的圖像質量，H.264的數據壓縮比能比DVD系統中使用的 MPEG-2高2 3倍，比MPEG-4高1.5 2倍。

舉個例子，原始文件的大小如果為100GB，採用MPEG-2壓縮標准壓縮後變成4GB，壓縮比為25 1，而採用H.264壓縮標准壓縮後變為1GB，從100GB到1GB，H.264的壓縮比達到驚人的100 1。尤其值得一提的是，H.264在具有高壓縮比的同時還擁有高質量流暢的圖像。

微軟是在2003年9月遞交VC-1編碼格式的，目前已經得到了MovieBeam、Modeo等不少公司的採納，同時也包含在HD DVD和藍光中，包括華納和環球等影業公司也有採用這種格式的意向。

VC-1基於微軟Windows Media Video9(WMV9)格式，而WMV9格式現在已經成為VC-1標準的實際執行部分。WMV (Windows Media

Video)是微軟公司的視頻編解碼器家族，包括WMV7、WMV8、WMV9、WPV10。這一族的編解碼器可以應用在從撥號上網的窄帶視頻到高清晰度電視HDTV)的寬頻視頻。使用Windows Media Video用戶還可以將視頻文件刻錄到CD、DVD或者其它一些設備上。它也

適用於用作媒體伺服器。

WMV可以被看作是MPEG-4的一個增強版本。最新的由SMPTE(電視電影工程師協會)承認的WMV-9,也就是我們說的上面的VC-1。

同一個 AVCodecID 可能對應多個不同的編解碼器 (AVCodec) MPEG-4 AVC、MPEG-4 Part 10，還是ISO/IEC 14496-10，都是指H.264。

在編碼方式相同相同的情況下，.avi, .mkv, .mp4隻是封裝格式的區別(文件後綴格式)，而封裝格式是不影響畫質的。

就相當於你的100塊錢折一下，或者兩下，或者兩下後不管是放在你的口袋裡，錢包里還是存錢罐里都是100塊錢。

這里的100塊錢就是就是視頻數據，你把100塊折一下，或者兩下，或者兩下就是編碼格式，錢包，口袋，存錢罐就是封裝格式。

㈤關於視頻壓縮的原理

視頻壓縮的原理是視頻圖像數據有很強的相關性，也就是說有大量的冗餘信息。其中冗餘信息可分為空域冗餘信息和時域冗餘信息。壓縮技術就是將數據中的冗餘信息去掉（去除數據之間的相關性），壓縮技術包含幀內圖像數據壓縮技術、幀間圖像數據壓縮技術和熵編碼壓縮技術。

(5)視頻壓縮編碼技術擴展閱讀：

視頻是連續的圖像序列，由連續的幀構成，一幀即為一幅圖像。由於人眼的視覺暫留效應，當幀序列以一定的速率播放時，我們看到的就是動作連續的視頻。由於連續的幀之間相似性極高，為便於儲存傳輸，我們需要對原始的視頻進行編碼壓縮，以去除空間、時間維度的冗餘。

視頻壓縮技術是計算機處理視頻的前提。視頻信號數字化後數據帶寬很高，通常在20MB/秒以上，因此計算機很難對之進行保存和處理。採用壓縮技術通常數據帶寬降到1-10MB/秒，這樣就可以將視頻信號保存在計算機中並作相應的處理。

㈥ MPEG視頻壓縮演算法的兩個基礎技術是什麼

1、基於塊的方式的運動補償：運動補償技術就是在動態序列圖像實時編碼中運用信息以及像素的位移向量進行圖像高效編碼的一種方法。活動圖像的幀與幀之間不僅存在基於像素的線性相關性，僅是前景改變，還在宏觀上存在著很大的運動相關性。

2、DCT變換：相當於一個長度大概是它兩倍的離散傅里葉變換，這個離散傅里葉變換是對一個實偶函數進行的（因為一個實偶函數的傅里葉變換仍然是一個實偶函數），在有些變形裡面需要將輸入或者輸出的位置移動半個單位。

(6)視頻壓縮編碼技術擴展閱讀：

MPEG的原理及優點：

MPEG 的基本原理是對比前後幀，第一幀被壓縮圖像將被用作參考，第二幀圖像中只有與參考幀不同的部分才會被存儲。播放時在參考幀圖像和「差異數據」的基礎上重建所有圖像。這樣的方法叫「差分編碼」（包括H.264在內的大多數視頻壓縮標准都採用這種方法）。

1、兼容性好，主要因為在一開始就被作為一個國際化的標准來研究制定。

2、能夠達到更高的壓縮比，最高可達200比1.

3、在提供高壓縮比的同時，數據損失造成的音、視頻失真很小。

㈦什麼是MPEG壓縮技術

MPEG的全名為[Moving Pictures Experts Group]，中文譯名是動態圖像專家組。MPEG標准主要有以下五個，MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。該專家組建於1988年，專門負責為CD建立視頻和音頻標准，而成員都是為視頻、音頻及系統領域的技術專家。及後，他們成功將聲音和影像的記錄脫離了傳統的模擬方式，建立了ISO/IEC1172壓縮編碼標准，並制定出MPEG-格式，令視聽傳播方面進入了數碼化時代。因此，大家現時泛指的MPEG-X版本，就是由ISO(International Organization for Standardization)所制定而發布的視頻、音頻、數據的壓縮標准。)

MPEG標準的視頻壓縮編碼技術主要利用了具有運動補償的幀間壓縮編碼技術以減小時間冗餘度，利用DCT技術以減小圖像的空間冗餘度，利用熵編碼則在信息表示方面減小了統計冗餘度。這幾種技術的綜合運用，大大增強了壓縮性能。

MPEG-1標准於1992年正式出版，標準的編號為ISO/IEC11172，其標題為「碼率約為1.5Mb/s用於數字存貯媒體活動圖像及其伴音的編碼」。

MPEG-2標准於1994年公布，包括編號為13818-1系統部分、編號為13818-2的視頻部分、編號為13818-3的音頻部分及編號為13818-4的符合性測試部分。

㈧監控視頻壓縮編碼格式特點

M-JPEG（Motion- Join Photographic Experts Group）技術即運動靜止圖像（或逐幀）壓縮技術，廣泛應用於非線性編輯領域可精確到幀編輯和多層圖像處理，把運動的視頻序列作為連續的靜止圖像來處理。

常用的演算法是由ISO制訂的，即JPEG和MPEG演算法。JPEG是靜態圖像壓縮標准，適用於連續色調彩色或灰度圖像，它包括兩部分：一是基於DPCM（空間線性預測）技術的無失真編碼，一是基於DCT（離散餘弦變換）和哈夫曼編碼的有失真演算法。

前者壓縮比很小，主要應用的是後一種演算法。在非線性編輯中最常用的是MJPEG演算法，即Motion JPEG。它是將視頻信號50幀/秒（PAL制式）變為25幀/秒，然後按照25幀/秒的速度使用JPEG演算法對每一幀壓縮。通常壓縮倍數在3.5-5倍時可以達到Betacam的圖像質量。

MPEG演算法是適用於動態視頻的壓縮演算法，它除了對單幅圖像進行編碼外還利用圖像序列中的相關原則，將冗餘去掉，這樣可以大大提高視頻的壓縮比。前MPEG-I用於VCD節目中，MPEG-II用於VOD、DVD節目中。

㈨視頻編解碼技術的分類

視頻壓縮編碼技術可以分為兩大類：無損壓縮和有損壓縮。
無損壓縮也稱為可逆編碼，指使用壓縮後的數據進行重構（即：解壓縮）時，重構後的數據與原來的數據完全相同。也就是說，解碼圖像和原始圖像嚴格相同，壓縮是完全可恢復的或無偏差的，沒有失真。無損壓縮用於要求重構的信號與原始信號完全一致的場合，例如磁碟文件的壓縮。
有損壓縮也稱為不可逆編碼，指使用壓縮後的數據進行重構（即：解壓縮）時，重構後的數據與原來的數據有差異，但不影響人們對原始資料所表達的信息造成誤解。也就是說，解碼圖像和原始圖像是有差別的，允許有一定的失真，但視覺效果一般是可以接受的。有損壓縮的應用范圍廣泛，例如視頻會議、可視電話、視頻廣播、視頻監控等。

㈩ MPEG是什麼格式

MPEG是ISO與IEC於1988年成立的專門針對運動圖像和語音壓縮制定國際標準的組織。

MPEG標准主要有以下五個，MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。該專家組建於1988年，專門負責為CD建立視頻和音頻標准，而成員都是為視頻、音頻及系統領域的技術專家。

及後，他們成功將聲音和影像的記錄脫離了傳統的模擬方式，建立了ISO/IEC11172壓縮編碼標准，並制定出MPEG-格式，令視聽傳播方面進入了數碼化時代。

MPEG技術包含兩個主要部分

視聽對象的編碼工具集和描述編碼工具和編碼對象的句法語言（syntatic language）。從技術的觀點看，與傳統編碼標准最顯著的不同是：接收者可以下載用於表示視聽信息的語法描述，並且具有很快被VLSI（超大規模集成）技術所支持的特徵。

MPEG支持用於通信、訪問和數字視聽數據處理的新方法，考慮到低損耗、高性能技術提供的機會和面臨迅速擴展的多媒體資料庫的挑戰，MPEG-4將提供靈活的框架和開放的工具集，這些工具將支持一些新型的和常規的功能。

導航:首頁 > 文件處理 > 視頻壓縮編碼技術

視頻壓縮編碼技術

與視頻壓縮編碼技術相關的資料