導航:首頁 > 源碼編譯 > 幀內預測演算法優化

幀內預測演算法優化

發布時間:2022-06-11 14:38:00

① 監控視頻壓縮編解碼的介紹

(一)、M-JPEG
M-JPEG(Motion- Join Photographic Experts Group)技術即運動靜止圖像(或逐幀)壓縮技術,廣泛應用於非線性編輯領域可精確到幀編輯和多層圖像處理,把運動的視頻序列作為連續的靜止圖像來處理,這種壓縮方式單獨完整地壓縮每一幀,在編輯過程中可隨機存儲每一幀,可進行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬體和軟體實現。但M-JPEG只對幀內的空間冗餘進行壓縮。不對幀間的時間冗餘進行壓縮,故壓縮效率不高。採用M-JPEG數字壓縮格式,當壓縮比7:1時,可提供相當於Betecam SP質量圖像的節目。
JPEG標准所根據的演算法是基於DCT(離散餘弦變換)和可變長編碼。JPEG的關鍵技術有變換編碼、量化、差分編碼、運動補償、霍夫曼編碼和遊程編碼等
M-JPEG的優點是:可以很容易做到精確到幀的編輯、設備比較成熟。缺點是壓縮效率不高。
此外,M-JPEG這種壓縮方式並不是一個完全統一的壓縮標准,不同廠家的編解碼器和存儲方式並沒有統一的規定格式。這也就是說,每個型號的視頻伺服器或編碼板有自己的M-JPEG版本,所以在伺服器之間的數據傳輸、非線性製作網路向伺服器的數據傳輸都根本是不可能的。
(二)、MPEG系列標准
MPEG是活動圖像專家組(Moving Picture Exports Group)的縮寫,於1988年成立,是為數字視/音頻制定壓縮標準的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權是制定用於「活動圖像」編碼的各種標准,隨後擴充為「及其伴隨的音頻」及其組合編碼。後來針對不同的應用需求,解除了「用於數字存儲媒體」的限制,成為現在制定「活動圖像和音頻編碼」標準的組織。MPEG組織制定的各個標准都有不同的目標和應用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標准。
1.MPEG-1標准
MPEG-1標准於1993年8月公布,用於傳輸1.5Mbps數據傳輸率的數字存儲媒體運動圖像及其伴音的編碼。該標准包括五個部分:
第一部分說明了如何根據第二部分(視頻)以及第三部分(音頻)的規定,對音頻和視頻進行復合編碼。第四部分說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規定的過程。第五部分是一個用完整的C語言實現的編碼和解碼器。
該標准從頒布的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以後的版本都帶有一個MPEG-1軟體解碼器,可攜式MPEG-1攝像機等等。
2.MPEG-2標准
MPEG組織於1994年推出MPEG-2壓縮標准,以實現視/音頻服務與應用互操作的可能性。MPEG-2標準是針對標准數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,編碼碼率從每秒3兆比特~100兆比特,標準的正式規范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標准。
MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗餘信息。如果我們能將這些冗餘信息去除,只保留少量非相關信息進行傳輸,就可以大大節省傳輸頻帶。而接收機利用這些非相關信息,按照一定的解碼演算法,可以在保證一定的圖像質量的前提下恢復原始圖像。一個好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗餘信息。
MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。
I幀圖像採用幀內編碼方式,即只利用了單幀圖像內的空間相關性,而沒有利用時間相關性。P幀和B幀圖像採用幀間編碼方式,即同時利用了空間和時間上的相關性。P幀圖像只採用前向時間預測,可以提高壓縮效率和圖像質量。P幀圖像中可以包含幀內編碼的部分,即P幀中的每一個宏塊可以是前向預測,也可以是幀內編碼。B幀圖像採用雙向時間預測,可以大大提高壓縮倍數。
MPEG-2的編碼碼流分為六個層次。為更好地表示編碼數據,MPEG-2用句法規定了一個層次性結構。它分為六層,自上到下分別是:圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。
MPEG-2標准在廣播電視領域中的主要應用如下:
(1)視音頻資料的保存
一直以來,電視節目、音像資料等都是用磁帶保存的。這種方式有很多弊端:易損,佔地大,成本高,難於重新使用。更重要的是難以長期保存,難以查找、難以共享。隨著計算機技術和視頻壓縮技術的發展,高速寬頻計算機網路以及大容量數據存儲系統給電視台節目的網路化存儲、查詢、共享、交流提供了可能。
採用MPEG-2壓縮編碼的DVD視盤,給資料保存帶來了新的希望。電視節目、音像資料等可通過MPEG-2編碼系統編碼,保存到低成本的CD-R光碟或高容量的可擦寫DVD-RAM上,也可利用DVD編著軟體(如Daikin Scenarist NT、Spruce DVDMaestro等)製作成標準的DVD視盤,既可節約開支,也可節省存放空間。
(2)電視節目的非線性編輯系統及其網路
在非線性編輯系統中,節目素材是以數字壓縮方式存儲、製作和播出的, 視頻壓縮技術是非線性編輯系統的技術基礎。目前主要有M-JPEG和MPEG-2兩種數字壓縮格式。
M-JPEG技術即運動靜止圖像(或逐幀)壓縮技術,可進行精確到幀的編輯,但壓縮效率不高。
MPEG-2採用幀間壓縮的方式,只需進行I幀的幀內壓縮處理,B幀和P幀通過偵測獲得,因此 ,傳輸和運算的數據大多由幀之間的時間相關性得到,相對來說,數據量小,可以實現較高的壓縮比。隨著逐幀編輯問題的解決,MPEG-2將廣泛應用於非線性編輯系統,並大大地降低編輯成本,同時MPEG-2的解壓縮是標準的,不同廠家設計的壓縮器件壓縮的數據可由其他廠家設計解壓縮器來解壓縮,這一點保證了各廠家的設備之間能完全兼容。
由於採用MPEG-2 IBP視頻壓縮技術,數據量成倍減少,降低了存儲成本,提高了數據傳輸速度,減少了對計算機匯流排和網路帶寬的壓力,可採用純乙太網組建非線性編輯網路系統已成為可能,而在目前乙太網是最為成熟的網路,系統管理比較完善,價格也比較低廉。
基於MPEG-2的非線性編輯系統及非線性編輯網路將成為未來的發展方向。
(3)衛星傳輸
MPEG-2已經通過ISO認可,並在廣播領域獲得廣泛的應用,如數字衛星視頻廣播(DVB-S)、DVD視盤和視頻會議等。目前,全球有數以千萬計的DVB-S用戶,DVB-S信號採用MPEG-2壓縮格式編碼,通過衛星或微波進行傳輸,在用戶端經MPEG-2衛星接收解碼器解碼,以供用戶觀看。此外,採用MPEG-2壓縮編碼技術,還可以進行遠程電視新聞或節目的傳輸和交流。
(4)電視節目的播出
在整個電視技術中播出是一個承上啟下的環節,對播出系統進行數字化改造是非常必要的,其中最關鍵一步就是構建硬碟播出系統。MPEG-2硬碟自動播出系統因編播簡便、儲存容量大、視頻指標高等優點,而為人們所青睞。但以往MPEG-2播出設備因非常昂貴,而只有少量使用。隨著MPEG-2技術的發展和相關產品成本的下降,MPEG-2硬碟自動系統播出可望得到普及。
3.MPEG-4標准
運動圖像專家組MPEG 於1999年2月正式公布了MPEG-4(ISO/IEC14496)標准第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標准。
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮演算法,它是針對數字電視、互動式繪圖應用(影音合成內容)、互動式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標准。MPEG-4標准將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通信及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領域普遍採用的統一數據格式。
MPEG-4的編碼理念是:MPEG-4標准同以前標準的最顯著的差別在於它是採用基於對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼後,再經過復用傳輸到接收端,然後再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象採用不同的編碼方法和表示方法,又有利於不同數據類型間的融合,並且這樣也可以方便的實現對於各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置於一個虛擬的演播室里,還可以在互聯網上方便的實現交互,根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。
MPEG-4系統的一般框架是:對自然或合成的視聽內容的表示;對視聽內容數據流的管理,如多點、同步、緩沖管理等;對靈活性的支持和對系統不同部分的配置。
與MPEG-1、MPEG-2相比,MPEG-4具有如下獨特的優點:
(1) 基於內容的交互性
MPEG-4提供了基於內容的多媒體數據訪問工具,如索引、超級鏈接、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體資料庫中有選擇地獲取自己所需的與對象有關的內容,並提供了內容的操作和位流編輯功能,可應用於互動式家庭購物,淡入淡出的數字化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場景或對象組合起來成為合成的多媒體數據。
(2)高效的壓縮性
MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標准相比,在相同的比特率下,它基於更高的視覺聽覺質量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發生的數據流進行編碼。一個場景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用於虛擬三維游戲、三維電影、飛行模擬練習等
(3)通用的訪問性
MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網路以及存儲介質中的應用,此外,MPEG-4還支持基於內容的的可分級性,即把內容、質量、復雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端。
這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:網際網路多媒體應用;廣播電視;互動式視頻游戲;實時可視通信;互動式存儲媒體應用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體應用;遠程視頻監控;通過ATM網路等進行的遠程資料庫業務等。MPEG-4主要應用如下:
(1)應用於網際網路視音頻廣播
由於上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基於TCP/IP的網際網路廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播。視頻點播的概念不是先把節目下載到硬碟,然後再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。
現在網際網路中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為網際網路視頻應用提供了一系列的標准工具,使視音頻碼流具有規范一致性。因此在網際網路播放視音頻採用MPEG-4,應該說是一個安全的選擇。
(2)應用於無線通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合於在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。
(3)應用於靜止圖像壓縮
靜止圖像(圖片)在網際網路中大量使用,現在網上的圖片壓縮多採用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基於小波變換的,在同樣質量條件下,壓縮後的文件大小約是JPEG壓縮文件的十分之一。把網際網路上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網路中的傳輸速度。
(4)應用於電視電話
傳統用於窄帶電視電話業務的壓縮編碼標准,如H261,採用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶的公用電話網上實現。
(5)應用於計算機圖形、動畫與模擬
MPEG-4特殊的編碼方式和強大的交互能力,使得基於MPEG-4的計算機圖形和動畫可以從各種來源的多媒體資料庫中獲取素材,並實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的范圍內向所希望的方向無限發展,產生出今天無法想像的動畫及模擬效果。
(6)應用於電子游戲
MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,並且能及時從各種來源的多媒體資料庫中調用素材。這可以在將來產生象電影一樣的電子游戲,實現極高自由度的互動式操作。
(三)H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用回歸基本的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,採用網路友好的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。 H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。 H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇增強內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。 H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有反變換誤差。 變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。 在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A+B+C+D+I+J+K+L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有4類模式。 H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
四、H.264的性能比較
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性。
H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。

② H.265的優勢

H.265/HEVC的編碼架構大致上和H.264/AVC的架構相似,主要也包含,幀內預測(intra prediction)、幀間預測(inter prediction)、轉換 (transform)、量化(quantization)、去區塊濾波器(deblocking filter)、熵編碼(entropy coding)等模塊,但在HEVC編碼架構中,整體被分為了三個基本單位,分別是:編碼單位(coding unit,CU)、預測單位(predict unit,PU) 和轉換單位(transform unit,TU )。
比起H.264/AVC,H.265/HEVC提供了更多不同的工具來降低碼率,以編碼單位來說,H.264中每個宏塊(macroblock/MB)大小都是固定的16x16像素,而H.265的編碼單位可以選擇從最小的8x8到最大的64x64。
以下圖為例,信息量不多的區域(顏色變化不明顯,比如車體的紅色部分和地面的灰色部分)劃分的宏塊較大,編碼後的碼字較少,而細節多的地方(輪胎)劃分的宏塊就相應的小和多一些,編碼後的碼字較多,這樣就相當於對圖像進行了有重點的編碼,從而降低了整體的碼率,編碼效率就相應提高了。

同時,H.265的幀內預測模式支持33種方向(H.264隻支持8種),並且提供了更好的運動補償處理和矢量預測方法。
反復的質量比較測試已經表明,在相同的圖象質量下,相比於H.264,通過H.265編碼的視頻大小將減少大約39-44%。由於質量控制的測定方法不同,這個數據也會有相應的變化。
通過主觀視覺測試得出的數據顯示,在碼率減少51-74%的情況下,H.265編碼視頻的質量還能與H.264編碼視頻近似甚至更好,其本質上說是比預期的信噪比(PSNR)要好。
這些主觀視覺測試的評判標准覆蓋了許多學科,包括心理學和人眼視覺特性等,視頻樣本非常廣泛,雖然它們不能作為最終結論,但這也是非常鼓舞人心的結果。
H.264與H.265編碼視頻的主觀視覺測試對比,我們可以看到後者的碼率比前者大大減少了
截止2013年的HEVC標准共有三種模式:Main、Main 10、Main Still Picture。Main模式支持8bit色深(即紅綠藍三色各有256個色度,共1670萬色),Main 10模式支持10bit色深,將會用於超高清電視(UHDTV)上。前兩者都將色度采樣格式限制為4:2:0。預期將在2014年對標准有所擴展,將會支持4:2:2和4:4:4采樣格式(即提供了更高的色彩還原度),和多視圖編碼(例如3D立體視頻編碼)。
事實上,H.265和H.264標准在各種功能上有一些重疊,例如,H.264標准中的Hi10P部分就支持10bit色深的視頻。另一個H.264的部分(Hi444PP)還可以支持4:4:4色度抽樣和14bit色深。在這種情況下,H.265和H.264的區別就體現在前者可以使用更少的帶寬來提供同樣的功能,其代價就是設備計算能力:H.265編碼的視頻需要更多的計算能力來解碼。
已經有支持H.265解碼的晶元發布了——博通公司在2013年1月初的CES大展上發布了一款Brahma BCM7445晶元,它是一個採用28納米工藝的四核處理器,可以同時轉碼四個1080P視頻數據流,或解析解析度為4096×2160的H.265編碼超高清視頻。
截止2013年,有線電視和數字電視廣播主要採用仍舊是MPEG-2標准。好消息是,H.265標準的出台最終可以說服廣播電視公司放棄垂垂老矣的MPEG-2,因為同樣的內容,H.265可以減少70-80%的帶寬消耗。這就可以在現有帶寬條件下輕松支持全高清1080p廣播。但是另一方面,電視廣播公司又很少有想要創新的理由,因為大多數有線電視公司在他們的目標市場中面臨的競爭實在是有限。出於節省帶寬的目的,反而是衛星電視公司可能將會率先採用H.265標准。
從長遠角度看,H.265標准將會成為超高清電視(UHDTV)的4K和8K解析度的選擇,但這也會帶來其它問題,比如2013年還極少有原生4K解析度的視頻內容。H.265標準的完成意味著內容擁有者在2013年已經有了一個對應的理論標准,但是他們在2013年還沒有一個統一的方式來傳送內容。
標清(SD)、高清(HD)和8K解析度超高清(UHD)視頻大小對比圖
藍光光碟協會(The Blu-ray Disc Association)正在研究在藍光光碟標准中支持4K解析度視頻的方法,但是這可沒那麼簡單。理論上H.264在擴展後就可以擁有這個功能,但是到那時碼率問題又會浮出水面。一個H.264編碼的4K藍光電影需要的存儲空間遠大於相同內容的H.265版本,其大小可高達100G以上,而現有的播放器也不支持100-128GB的高容量可刻錄可擦寫光碟(BDXL)。
到目前為止,仍然沒有一個妥善解決方案,可以將4K解析度視頻加入已有的藍游標准中並且不破壞其兼容性。雖然更新到H.265標准並不需要對光碟製造工藝進行改進,但卻需要製造全新的播放器才能將新的藍光光碟播放出來,雖然截止2013年的有些播放器可以播放高密度光碟,但那也需要進行設備檢查升級才行。
另一個大問題就是游戲主機對H.265標準的支持。索尼的PS2和PS3主機推動了DVD和藍游標準的發展,而即將發布的PS4理論上很可能將支持4K解析度的內容,但4K解析度的視頻該怎樣傳送,通過哪些標准進行支持?這仍然還在討論中。
目前看來,對於H.265/HEVC標准,我們仍需持謹慎樂觀態度。但有一點是肯定的:H.265標准在同等的內容質量上會顯著減少帶寬消耗,有了H.265,高清1080P電視廣播和4K視頻的網路播放將不在困難,但前提是索尼或者其它媒體巨頭能想出辦法來傳送這些內容。同時,如果移動設備要採用H.265標准,那麼其在解碼視頻時對電量的高消耗也是各大廠商需要解決的問題。

③ 為什麼說H.265比H.264更高效

詳細的你可以網路,我復制黏貼一堆專業東西給你看我想對你也沒啥幫助吧。
簡單說就是H.265對H.264演算法進行了優化,所以壓縮效率更高,相同的質量比H.264需要的碼率更小,這樣看在線視頻需要的帶寬也就更小了。對高分視頻來說H.265的確是個福音,H.264的4k少女時代樣片,3分半的視頻,就要2.5G。如果用H.265同樣質量只要1G多就行。

④ 周兵的學術成就

科研課題(1)2008.8-2009.7,大規模高清視頻直播系統 863計劃項目,技術主持(2)2009.1-2010.6, CNGI090213「智能化IPv6無線網路監控系統」,國家發改委產業化項目,與河南金鵬科技公司合作,技術主持(3)2005.3-2007.12,河南省高校傑出人才創新工程項目 「新一代視頻會議系統」,經費20萬元,主持(4)2001-2003,中國國家自然科學基金「基於自適應搜索的快速運動估計演算法研究」 經費18萬元,已完成(2003年底結題),負責;(5)2000-2002,中國國家自然科學基金「基於小波的啟發式分形編碼技術」 經費12萬元,已完成,參加(名次3);(6)2000年1月—2003年12月,中國國家自然科學基金(重點項目)視頻信息檢索的關鍵技術,經費70萬元,與復旦大學聯合申請,參加(北航名次2),北航負責任務已完成。(7)2001-2002,中國國家863計劃項目「數字視頻的壓縮、傳輸與存儲研究」 經費40萬元,已完成,參加(名次3);(8)2000-2000,中國國家863計劃項目「數字化家庭監控系統「經費15萬元,參加(名次3);(9)1999-2000,中國國家863計劃項目「多媒體數據壓縮標准MPEG的實現技術」經費15萬元,已完成,參加(名次2);專利:[1]周兵,王宗敏,李曉強,甚低碼率視頻編碼器碼率控制方法[2]蘇士美,周兵,王宗敏,一種H.264快速幀間模式選擇方法[3]周兵,王宗敏,黃雪莉,嵌入式視頻編碼器量化方法獲獎情況1989年「人工智慧計算機LISP-M1的研製」,國家教委科技進步二等獎和陝西省教委科技進步一等獎;1998.4-1998.12,編寫科技著作《VB5與Internet應用》,獲得1999年度河南省科技進步二等獎;1999-2002 基於軟構件技術的用電管理系統獲得2002年度河南省科技進步三等獎;2003-2004 基於Web的嵌入式監控系統獲得2005年度河南省科技進步二等獎。主要論著劉恩虹,周兵,葛寶珊,李曉丹. 基於H.264的嵌入式視頻編碼器.計算機工程,2009-05-05黃雪莉,周兵. H.264快速幀間模式選擇演算法.計算機工程, 2009-05-05甘勇,周兵,李曉強,錢德沛. 甚低碼率視頻編碼器碼率控制策略.計算機工程,2008-12-05趙偉,周兵. 基於ERP系統的消息中間件設計與實現.計算機工程,2008-05-20趙鵬,周兵. Windows Mobile平台上H.264解碼器的優化.計算機科學,2008年2期,核心期刊王維哲, 周兵. H.264編碼中的幀內預測模式選擇演算法.計算機工程-2008年2期,核心期刊甘勇,蘇士美,周兵,錢德沛. 嵌入式視頻編碼器量化演算法優化. 通信學報.2007.6,靳志峰,周兵,張宏坡. P2P視頻會議系統中的媒體流組播樹的生成與維護.計算機科學,2007年 34卷 8期,核心期刊周兵,李偉. 基於B/S模式的組件化網路多媒體監控系統結構研究. 計算機科學,2006年第1期王文義,周兵. VB5與Internet應用,西安交通大學出版社,1998

⑤ H.265是什麼,為啥宅男都在說這個

H.265是ITU-T VCEG 繼H.264之後所制定的新的視頻編碼標准。H.265標准圍繞著現有的視頻編碼標准H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼質量、延時和演算法復雜度之間的關系,達到最優化設置。具體的研究內容包括:提高壓縮效率、提高魯棒性和錯誤恢復能力、減少實時的時延、減少信道獲取時間和隨機接入時延、降低復雜度等。H264由於演算法優化,可以低於1Mbps的速度實現標清數字圖像傳送;H265則可以實現利用1~2Mbps的傳輸速度傳送720P(解析度1280*720)普通高清音視頻傳送。

⑥ 視頻圖像幀之間的預測編碼有哪些方法

預測編碼數據壓縮技術建立在信號數據的相關性上。

一, 它根據某一模型,利用以前的樣本值對新樣本進行預測,以此減少數據在時間和空間上的相關性,從而達到壓縮數據的目的,但在實際預測編碼時 ,一般不是建立在數據源的數學模型上,而是基於估計理論,現代統計學理論,這是因為數據源的數學模型很難建立,有時根本無法得到其數學模型,例如時變隨機系統。預測編碼的演算法有很多,在圖像編碼常用的是DPCM(different Pulse Code Molation),即:差分脈沖編碼調制方法。

二,預測編碼的基本思想是通過對每個像素中新增信息進行提取和編碼,以此來消除像素間的冗餘,這里新增信息是指像素當前實際值和預測值的差。也就是說,如果已知圖像一個像素離散幅度的真實值,利用其相鄰像素的相關性,預測它的可能數值,再求兩者的差。利用這種具有預測性質的差值,再量化、編碼傳輸,其效果更佳,這種方法稱為DPCM法。

因此,我們知道,在預測編碼中,編碼和傳輸的並不是像素采樣值本身,而是這個采樣值的預測值與實際值的差值。

⑦ 求一篇「對多媒體的數據壓縮技術或數據加密技術做實例分析,並研究它的發展趨勢」有關的論文。

多媒體數據壓縮方法分類數據的壓縮實際上是一個編碼過程,即把原始的數據進行編碼壓縮。數據的解壓縮是數據壓縮的逆過程,即把壓縮的編碼還原為原始數據。因此數據壓縮方法也稱為編碼方法。目前數據壓縮技術日臻惱,適應各種應用場合的編碼方法不斷產生。針對多媒體數據冗餘類型的不同,相應地有不同的壓縮方法。 按照壓縮方法是否產生失真分類根據解碼後數據與原始數據是否完全一致進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。 有失真壓縮法會壓縮了熵,會減少信息量,而損失的信息是不能再恢復的,因此這種壓縮法是不可逆的。無失真壓縮法掉或減少數據中的冗餘,但這些冗餘值是可以重新插入到數據中的,因此冗餘壓縮是可逆的過程。 無失真壓縮是不會產生失真。從信息主義角度講,無失真編碼是泛指那種不考慮被壓縮信息性質和壓縮技術。它是基於平均信息量的技術,並把所有的數據當做比特序列,而不是根據壓縮信息的類型來優化壓縮。也就是說,平均信息量編碼忽略被壓縮信息主義內容。在多媒體技術中一般用於文本、數據的壓縮,它能保證百分之百地恢復原始數據。但這種方法壓縮比較低,如LZW編碼、行程編碼、霍夫曼(Huffman)編碼的壓縮比一般在2:1至5:1之間。 按照壓縮方法的原理分類根據編碼原理進行分類,大致有編碼、變換編碼、統計編碼、分析-合成編碼、混合編碼和其他一些編碼方法。其中統計編碼是無失真的編碼,其他編碼方法基本上都是有失真的編碼。 預測編碼是針對空間冗餘的壓縮方法,其基本思想是利用已被編碼的點的數據值,預測鄰近的一個像素點的數據值。預測根據某個模型進行。如果模型選取得足夠好的話,則只需存儲和傳輸起始像素和模型參數就可代表全部數據了。按照模型的不同,預測編碼又可分為線性預測、幀內預測和幀間預測。 變換編碼也是針對空間冗餘和時間冗餘的壓縮方法。其基本思想是將圖像的光強矩陣(時域信號)變換到系統空間(頻域)上,然後對系統進行編碼壓縮。在空間上具有強相關性的信號,反映在頻域上是某些特定區域內的能量常常被集中在一起,或者是系數矩陣的發布具有某些規律。可以利用這些規律,分配頻域上的量化比特數,從而達到壓縮的目的。由於時域映射到頻域總是通過某種變換進行的,因此稱變換編碼。因為正交變換的變換矩陣是可逆的,且逆矩陣與轉換置矩陣相等,解碼運算方便且保證有解,所以變換編碼總是採用正交變換。 統計編碼屬於無失真編碼。它是根據信息出現概率的分布而進行的壓縮編碼。編碼時某種比特或位元組模式的出現概率大,用較短的碼字表示;出現概率小,用較長的碼字表示。這樣,可以保證總的平均碼長最短。最常用的統計編碼方法是哈夫曼編碼方法。 分析-合成編碼實質上都是通過對原始數據的分析,將其分解成一系列更適合於表示「基元」或從中提取若干具有更為本質意義的參數,編碼僅對這些基本單元或特徵參數進行。解碼時則藉助於一定的規則或模型,按一定的演算法將這些基元或參數,「綜合」成原數據的一個逼近。這種編碼方法可能得到極高的數據壓縮比。 混合編碼綜合兩種以上的編碼方法,這些編碼方法必須針對不同的冗餘進行壓縮,使總的壓縮性能得到加強。

⑧ H.265標准與H264標准有什麼區別

H.265是新的編碼協議,也即是H.264的升級版。

他們核心區別的可以分兩步看:
1同樣的畫質和同樣的碼率,H.265比H2.64 佔用的存儲空間要少理論50%。
2如果存儲空間一樣大,那麼意味著,在一樣的碼率下H.265會比H2.64 畫質要高一些理論值是30%~40%

⑨ 介紹幾個你比較熟悉的設計模式,並簡單介紹它們是如何實現的

以下是幾種格式的專業解釋:

HDTV

一,HDTV的概念

要解釋HDTV,我們首先要了解DTV。DTV是一種數字電視技術,是目前傳統模擬電視技術的接班人。所謂的數字電視,是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號,或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來 完成的。數字信號的傳播速率為每秒19.39兆位元組,如此大的數據流傳輸速度保證了數字電視的高清晰度,克服了模擬電視的先天不足。同時,由於數字電視可以允許幾種制式信號的同時存在,因此每個數字頻道下又可分為若干個子頻道,能夠滿足以後頻道不斷增多的 需求。HDTV是DTV標准中最高的一種,即High Definision TV,故而稱為HDTV。

二,HDTV中要求音、視頻信號達到哪些標准?

HDTV規定了視頻必須至少具備720線非交錯式(720p,即常說的逐行)或1080線交錯式隔行(1080i,即常說的隔行)掃描(DVD標准為 480線),屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式),同時能兼容接收其它較低格式的 信號並進行數字化處理重放。

HDTV有三種顯示格式,分別是:720P(1280×720P,非交錯式),1080 i(1920×1080i,交錯式),1080P(1920×1080i,非交錯式),其中網路上流傳的以720P和1080 i最為常見,而在微軟WMV-HD站點上1080P的樣片相對較多。

三,如何收看HDTV節目?

目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV,需要滿足兩個條件,首先是電視可接收到HDTV信號,這需要額外添加相關的硬體,其次是電視符合HDTV標准,主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號,而且HDTV電視的價格仍高高在上,不是普通消費者所能承受的。因此,在網路中找尋HDTC源,下載後在個人電腦上播放,成了大多數HDTV迷們的一個嘗鮮方法。

四,哪些是可用於電腦播放的HDTV文件?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

HDTV文件都比較大,即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算,.wmv文件將會有4G以上,而同樣時間長度的.tp和.ts文件能達到8G以上,有的甚至達到20多G。因此,除了通過文件後綴名,還可以通過文 件大小來判斷是否為HDTV文件。

五,如何在個人電腦上播放HDTV節目?

對於.wmv文件,只要系統安裝了Windows Media Player 9 或更高版本,就可以正常播放,一些播放軟體的最新版本已經開始支持WMV-HD,如WINDVD6等,也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式,就需要安裝對應的解碼器,遇到Windows Media Player 9不能正常播放時,可以再安裝ffdshow,它帶有各種最常用的解碼器。

播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點,因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了,Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體,目前最新的版本為2.x。安裝完後,也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。

六,如何鑒別HDTV的顯示格式?

目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i,或是1080P,但是有不少軟體可以在播放時顯示影片的圖像信息,如WINDVD、zplay等,在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。

七,為什麼我只能看到圖像,卻聽不到聲音?

這是因為未安裝AC3音頻解碼器,導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器,常用的有 AC3Filter,這些音、視頻解碼器只需安裝一次即可,播放HDTV文件時系統會自動調用,而不必每次播 放的時候都打開其控制界面。

八,為什麼我播放HDTV時會出現丟幀現象?

在家用電腦上播放HDTV,對其硬體配置要求較高,主要是與CPU、顯存、內存緊緊相關,如果這三樣中有一樣性能過低,就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的,尤其是在播放1080 i格式HDTV的時候,1920×1080的像素量,需要足夠大的顯存才能滿足其數據吞吐,因此顯存至少需要64M以上,建議128M。由於是2D顯示,所以對顯卡核心的運算能力要求反而不是很高。

九,為什麼我播放HDTV時會經常出現畫面和語音停頓的現象?

一些採用了WMV-HD重新編碼的HDTV文件,因為有著較高的壓縮率,在播放時就需要非常高的CPU運算能力來進行實時解碼,一般來說P4 2.0G/AMD 2000+ 以上及同級別的CPU可達到這個要求。同時,由於HDTV的數據流較大,需要足夠的內存來支持,推薦在256M以上。如果你的電腦滿足不了這樣的配置,就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果 這種現象不太嚴重,則可以通過優化系統和一些小技巧來改善。

十,如何優化系統以保證順利地播放HDTV?

除非你的電腦硬體配置的確很強,否則就很可能需要對系統進行一些優化,以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程,盡量增加系統的空閑資源為播放HDTV服務;其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多,在硬體配置本就不高的系統上會影響HDTV的播放效果,這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體,最大的特點就是佔用系統資源很小,尤其在播放HDTV文件時,與其它幾個資源佔用大戶相比效果更為明顯。另外,運行播放軟體後立即打開任務管理器(僅在Windows 2000/XP中有效),將播放軟體的進程級別設置為最高,這樣也可以為HDTV的播放調用更多的系統資源。除此之外,安裝更高版本的 DirectX,也能更好地支持HDTV的播放。

十一,還有什麼其它的技巧?

如果你的PC可以流利地播放HDTV,那麼你唯一會感到遺憾的,可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決,必竟PC音箱和家庭影院的音箱兩者是不可同比的,然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。 現在主流的顯示器為17寸純平CRT(因為改變標准解析度只會給LCD帶來負面影響,因此這種方法只針對普通的CRT顯示器),中低檔的17寸顯示器很難達到1600×1200以上的解析度,即使達到了其水平掃描率也在60Hz以下,但是請不要忘了,電視 信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz,1080i則有50Hz和60Hz兩種,分別為我國和美國地區的標准。也就是說,即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻,你是感覺不到晃眼的 ,這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候,放心地將顯示器水平掃描率設為60Hz,進而將解析度調高,平時使用再調回標准解析度即可。

存放HDTV文件的硬碟分區必須轉換為NTFS格式,因為一部HDTV電影通常是幾個4.3GB的視頻文件組成(為了方便刻錄在DVD上面),而FAT32是無法管理2GB以上的文件的,因此務必轉換分區格式。

H.264

JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准,以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標准稱為H.264標准,該標准也被ISO接納,稱為AVC(Advanced Video Coding)標准,是MPEG-4的第10部分。
H.264標准可分為三檔:
基本檔次(其簡單版本,應用面廣);
主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);
擴展檔次(可用於各種網路的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網路中的分組傳輸,支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸,網路親和性好。

H.261是最早出現的視頻編碼建議,目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合於面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准,在技術上是H.261的改進和擴充,支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263+和H.263++已發展成支持全碼率應用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質量的圖像,是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似,也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀(I)、預測幀(P)、雙向預測幀(B)和直流幀(D)等概念,進一步提高了編碼效率。在MPEG-1的基礎上,MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進,例如它的運動矢量的精度為半像素;在編碼運算中(如運動估計和DCT)區分「幀」和「場」;引入了編碼的可分級性技術,如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術,如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之,H.261建議是視頻編碼的經典之作,H.263是其發展,並將逐步在實際上取而代之,主要應用於通信方面,但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用,其核心視頻編碼的基本框架是和H.261一致的,其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙,目前還難以普遍應用。因此,在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點,在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向實際應用。同時,它是兩大國際標准化組織的共同制定的,其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,採用「網路友好」的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
(1) 分層設計
H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。
(2) 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。
(3) 4×4塊的整數變換
H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有「反變換誤差」。變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。
(4) 統一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號採用統一的VLC(UVLC :Universal VLC),另一種是採用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里,x0,x1,x2,…是INFO比特,並且為0或1。圖4列出了前9種碼字。如:第4號碼字包含INFO01,這一碼字的設計是為快速再同步而經過優化的,以防止誤碼。
(5) 幀內預測
在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A+B+C+D+I+J+K+L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。
(6) 面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性,如圖5所示。
H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言,在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說,H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用,這一次我們走到了世界的前端!

1080p

1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是,FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.

WAF

We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組,他們製作的DVDRIP是目前網上除了HDTV之外質量最好的,清晰度和音質都是上乘之作。
WAF的作品有以下特點:
1:嚴格控制每CD的容量,每CD的容量大小一般不超過0.05M(大家見過不少CD1是702M,CD2卻是698M的現象吧)。
2:經過控制的容量,利於刻盤,(有些小組製作的容量經常可以超過702M,一CD盤的容量,這時候超刻技術就受重視了^_^)
3:分割片子時注意場景轉換,極少造成一段場景有分裂感(例如4CD的《特洛伊》和4CD的《黑鷹》)。
4:每個片子壓制的尺寸都以OAR為准,即導演原始版。
5:尺寸統一,幾乎都是800線。(例:WAF20CD DTS版BOB,800*448,見過15CD的HDTVRIP版,居然有兩種尺寸!)我不清楚,一部大片為什麼大家會忍受得了解析度為640甚至以下的版本?
6:有極強的負責任的製作態度,發現有瑕疵的一般都會推出修復版.
7:喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻.
8:WAF每部片分割成的CD數一般都比別的小組製作的要多,這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌,卻只分割成2CD,每CD有70多分鍾長,不知這樣壓縮出來的片子畫質能好到什麼程度?
所以說,WAF小組出品的DVDRip一般都是網上最清晰的版本。

問題補充:

普通家用電視的解析度是多少?是不是屏幕越大解析度越高?

電視的NTSC標准為720x480 刷新率為60Hz , PAL為720x576,刷新率為50Hz。 我國電視廣播採用 PAL制。

逐行電視接收隔行信號經過差補後可以達到逐行輸出,同時75Hz刷新率 ,或者隔行輸出,同時100Hz刷新率。

雖然PAL制可達576線,但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i,就是說最多逐行720線。所以按理論來說,搞清電視用1024x768的VGA輸入也勉強可以表現出來了,但實際因為聚焦不準,文字顯示比能顯示1024x768的顯示器差很多,畫面顯示則沒什麼問題。

HDTV是不是沒有經過壓縮,最原始的視頻?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

H.264等壓縮格式是不是為了方便網上傳播?

在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。

H.264能以較低的數據速率傳送基於聯網協議(IP)的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。

網上流傳的Rip格式是什麼意思?DVDRip

DVDRip理解:其實就是一種DVD的備份技術。

DVD我們都知道,目前非常優秀的媒體格式,MPEG2編碼的視頻;AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟,D5一張就有4.7G。顯然,直接將DVD文件進行網路傳送毫無實際價值可言,將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影,更不要說將它們保存下來,DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了,將DVD的視頻、音頻、字幕剝離出來,再經過壓縮或者其他處理,然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。

閱讀全文

與幀內預測演算法優化相關的資料

熱點內容
樂高機器人nxt編程軟體 瀏覽:583
linuxx264編譯 瀏覽:343
華夏銀行網銀盾用什麼app 瀏覽:583
單片機棧區 瀏覽:64
直流馬達如何連接5v單片機 瀏覽:261
後綴為win的文件怎麼解壓 瀏覽:802
壓縮包解壓後為什麼一張白紙 瀏覽:585
伺服器和雲盒子 瀏覽:172
python畫cad電氣圖 瀏覽:419
三菱plcfx3sa編程電纜 瀏覽:314
山西視頻加密防盜 瀏覽:839
華為mml命令查看用戶量 瀏覽:907
場論朗道pdf 瀏覽:373
如何使用qtquick編譯器 瀏覽:50
山西高配伺服器雲伺服器 瀏覽:744
為什麼編譯按f9沒反應 瀏覽:122
購物app都適合買什麼東西 瀏覽:277
savetxt函數python 瀏覽:577
編譯器小端改大端 瀏覽:642
華為安卓哪些文件夾能刪除 瀏覽:406