1. 視頻編碼標準是什麼
視頻編碼標準是主要應用於實時視頻通信領域,如會議電視;MPEG系列標準是由ISO/IEC制定的,主要應用於視頻存儲(DVD)、廣播電視、網際網路或無線網上的流媒體等。
數字視頻技術廣泛應用於通信、計算機、廣播電視等領域,帶來了會議電視、可視電話及數字電視、媒體存儲等一系列應用,促使了許多視頻編碼標準的產生。
ITU-T與ISO/IEC是制定視頻編碼標準的兩大組織,ITU-T的標准包括H.261、H.263、H.264,兩個組織也共同制定了一些標准,H.262標准等同於MPEG-2的視頻編碼標准,而最新的H.264標准則被納入MPEG-4的第10部分。
常見視頻格式
1、AVI格式
它的英文全稱為Audio Video Interleaved,即音頻視頻交錯格式。它於1992年被Microsoft公司推出,隨Windows3.1一起被人們所認識和熟知。所謂「音頻視頻交錯」,就是可以將視頻和音頻交織在一起進行同步播放。
這種視頻格式的優點是圖像質量好,可以跨多個平台使用,但是其缺點是體積過於龐大,而且更加糟糕的是壓縮標准不統一,因此經常會遇到高版本Windows媒體播放器播放不了採用早期編碼編輯的AVI格式視頻,而低版本Windows媒體播放器又播放不了採用最新編碼編輯的AVI格式視頻。
其實解決的方法也非常簡單,我們將在後面的視頻轉換、視頻修復部分中給出解決的方案。
2、DV-AVI格式
DV的英文全稱是Digital Video Format,是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。非常流行的數碼攝像機就是使用這種格式記錄視頻數據的。
它可以通過電腦的IEEE 1394埠傳輸視頻數據到電腦,也可以將電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般也是.avi,所以我們習慣地叫它為DV-AVI格式。
2. 視頻編碼h264和h265是什麼意思
1、H.265
H.265是ITU-TVCEG繼H.264之後所制定的新的視頻編碼標准。H.265標准圍繞著現有的視頻編碼標准H.264,保留原來的某些技術,同時對一些相關的技術加以改進。新技術使用先進的技術用以改善碼流、編碼質量、延時和演算法復雜度之間的關系,達到最優化設置。
具體的研究內容包括:提高壓縮效率、提高魯棒性和錯誤恢復能力、減少實時的時延、減少信道獲取時間和隨機接入時延、降低復雜度等。H264由於演算法優化,可以低於1Mbps的速度實現標清數字圖像傳送;H265則可以實現利用1~2Mbps的傳輸速度傳送720P(解析度1280*720)普通高清音視頻傳送。
H.265旨在在有限帶寬下傳輸更高質量的網路視頻,僅需原先的一半帶寬即可播放相同質量的視頻。這也意味著,我們的智能手機、平板機等移動設備將能夠直接在線播放1080p的全高清視頻。
H.265標准也同時支持4K(4096×2160)和8K(8192×4320)超高清視頻。可以說,H.265標准讓網路視頻跟上了顯示屏「高解析度化」的腳步。
2、H.264
H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態圖像專家組(MPEG)聯合組成的聯合視頻組(JVT,Joint Video Team)提出的高度壓縮數字視頻編解碼器標准。
這個標准通常被稱之為H.264/AVC(或者AVC/H.264或者H.264/MPEG-4AVC或MPEG-4/H.264 AVC)而明確的說明它兩方面的開發者。
H.264最大的優勢是具有很高的數據壓縮比率,在同等圖像質量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。舉個例子,原始文件的大小如果為88GB,採用MPEG-2壓縮標准壓縮後變成3.5GB,壓縮比為25∶1。
而採用H.264壓縮標准壓縮後變為879MB,從88GB到879MB,H.264的壓縮比達到驚人的102∶1。低碼率(Low Bit Rate)對H.264的高的壓縮比起到了重要的作用,和MPEG-2和MPEG-4ASP等壓縮技術相比,H.264壓縮技術將大大節省用戶的下載時間和數據流量收費。
尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質量流暢的圖像,正因為如此,經過H.264壓縮的視頻數據,在網路傳輸過程中所需要的帶寬更少,也更加經濟。
3. h264是什麼視頻格式,這種格式有什麼特點
h264不屬於視頻格式,而是一種視頻編碼標准,跟avi、mpg不屬於同一類。
H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組和ISO/IEC動態圖像專家組聯合組成的聯合視頻組提出的高度壓縮數字視頻編解碼器標准。這個標准通常被稱之為H.264/AVC。
H.264是國際標准化組織(ISO)和國際電信聯盟(ITU)共同提出的繼MPEG4之後的新一代數字視頻壓縮格式。H.264是ITU-T以H.26x系列為名稱命名的視頻編解碼技術標准之一。
特點:
1.低碼率:和MPEG2和MPEG4 ASP等壓縮技術相比,在同等圖像質量下,採用H.264技術壓縮後的數據量只有MPEG2的1/8,MPEG4的1/3。
2.高質量的圖像:H.264能提供連續、流暢的高質量圖像。
3.容錯能力強:H.264提供了解決在不穩定網路環境下容易發生的丟包等錯誤的必要工具。
4.網路適應性強:H.264提供了網路抽象層,使得H.264的文件能容易地在不同網路上傳輸。
(3)數字視頻壓縮標准擴展閱讀
國際上制定視頻編解碼技術的組織有兩個,一個是「國際電聯(ITU-T)」,它制定的標准有H.261、H.263、H.263+等,另一個是「國際標准化組織(ISO)」它制定的標准有MPEG-1、MPEG-2、MPEG-4等。
所謂視頻編碼方式就是指通過特定的壓縮技術,將某個視頻格式的文件轉換成另一種視頻格式文件的方式。視頻流傳輸中最為重要的編解碼標准有國際電聯的H.261、H.263、H.264,運動靜止圖像專家組的M-JPEG和國際標准化組織運動圖像專家組的MPEG系列標准。
參考資料來源:網路-H.264
參考資料來源:網路-視頻編碼
4. 高清視頻壓縮的格式介紹
這一個比較古老的編碼形式,由動態圖像專業組織(Moving Pictureures Experts Group即MPEG)於1994年推出的壓縮標准。
由於壓縮比例較低,已經較為少見。一般一部120分鍾長1080p的電影在此種格式下的大小約為30G上下。 MPEG-4多用於HDTVrip上,直接在HDTV上採用MPEG-4視頻壓縮的很少見。HDTVrip的MPEG-4編碼可以理解為:通過把原有的HDTV文件按照比例縮小到一定的尺寸,以達到在減少文件大小、方便傳輸的同時畫面效果不低於DVD效果的目的。可以說這種編碼格式是為了達到一種畫面效果和文件尺寸的平衡。
由於各個商業集團的紛爭,MPEG-4的標准比較混亂,主要基於MPEG-4的常見標准有DivX和XviD。
DivX是一項由DivXNetworks公司發明的,類似於MP3的數字多媒體壓縮技術。由於Divx後來轉為了商業軟體,其發展受到了很大限制,表現相對欠佳,逐漸在競爭中處於了劣勢。
XviD則是一個開放源碼的MPEG-4 多媒體解碼器,它是基於OpenDivX而編寫的。XviD是由一群原OpenDivX義務開發者在OpenDivX於2001年7月停止開發後自行開發的,應用較廣泛。一部720p的90分鍾長的電影大概在4.3G左右,同時畫面有普通1080p的80%~90%。
MPEG-4具有很多優點。它的壓縮率可以超過100倍,而仍保有極佳的音質和畫質;它可利用最少的數據,獲取最佳的圖像質量,滿足低碼率應用的需求;它更適合於互動式AV服務及遠程監控。具體如下:
1.形狀編碼
形狀信息的獲得首先要對圖形進行分析和分割,把各個代表不同內容的目標分割後再用形狀表示。形狀信息通常用二值
Alpha平面來表示。二值Alpha平面可用臨近信息進行算術編碼(CAE);灰度Alpha平面可用運動補償加DCT變換方式類似紋理編碼一樣進行編碼。
其中用於圖像壓縮的變換有離散Forier變換(DFT)、離散小波變換(DWT)、奇異值分解(SVD)、K-L變換、Walsh變換、Hadamard變換、Harr變換、Slant變換、離散餘弦變換(DCT)。其中K-L變換的去相關性最好,而DCT是接近K-L變換效果的最便於實現的變換。和MPEG-1/2一樣,MPEG-4也選擇了DCT。通常,用於數據壓縮的熵編碼方法有霍夫曼(Huffman)編碼、矢量量化、算術編碼、遊程編碼、LZW編碼等。對於紋理編碼,MPEG-4選擇了把遊程編碼、矢量量化和Huffman編碼進行混合編程編碼(VLC)。紋理編碼要經過DCT變換、量化、DC/AC預測、掃描、基於Hufman的VLC編碼。
2.運動估計和補償
MPEG-4中提供了基於塊的運動估計和補償技術來有效地利用各個VOP中視頻內容上的時間冗餘。一般,運動估計和補償可以看作針對任意形狀圖像序列的塊匹配技術的延伸。塊匹配過程對於標准宏塊使用;預測誤差和用於預測的宏塊運動向量一起被編碼;高級運動補償模式支持重疊塊運動補償,可對8×8塊運動向量進行編碼。為了使運動估計得到高編碼效率,預測圖像和被預測圖像越相似越好,所以在運動估計之前要先進行補償。在目標邊界上的MB先用水平填補而後用垂直填補,其餘完全在VOP之外的MB用擴張填補。
3.紋理編碼
紋理指的是I-VOP圖像和P/B-VOP經運動補償後殘留的圖像信息。紋理一般在變換域進行壓縮編碼和熵編碼。准正式編輯已經出版:靜態圖像壓縮編碼標准(JPEG);數字聲像儲存壓縮編碼標准(MPEG-1);通用視頻圖像壓縮編碼標准(MPEG-2)。
隨後,MPEG專家組於1999年2月正式公布了MPEG-4(ISO/IEC14496)V1.0版本。同年底MPEG-4V2.0版本亦告完成,且於2000年年初正式成為國際標准。MPEG-4標准將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通信及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用普遍採用的統一數據格式,並根據不同的應用需求,現場配置解碼器,開放的編碼系統也可隨時加入新的有效的演算法模塊。為支持對視頻內容的訪問,MPEG-4提出了「視頻對象」的概念。
4.伸屈性
MPEG專家組又推出了專門支持多媒體信息且基於內容檢索的編碼方案MPEG-7及多媒體框架標准MPEG-21。另外,由ITU-T和MPEG聯合開發的新標准H.264是最新的視頻編碼演算法。為了降低碼率,獲得盡可能更好圖像質量,H.264標准吸取了MPEG-4的長處,具有更高的壓縮比、更好的信道適應性,必將在數字視頻的通信和存儲領域得到廣泛的應用,其發展潛力不可限量。
視頻的伸屈性,包括空間伸屈性和時間伸屈性。空間伸屈性可以得到不同的空間解析度,時間伸屈性可得到不同的時間解析度。每種伸屈都有多層,在只有高低2層的情況下,底層指的是基本層,而高層指的是增強層。
5.差錯迴避
VLC碼中的一個比特錯誤會引起同步丟失,而運動補償則會引起錯誤傳遞。MPEG-4的差錯迴避有三個方面:重同步、數據恢復和錯誤隱藏。重同步,是指差錯被檢測後,解碼器和碼流之間重新同步的技術。一般來說,這種方法會將錯誤之前的同步點到重建的同步點之間的數據丟棄。不過這些丟棄的數據可以用其他的技術進行恢復和實施錯誤隱藏。數據恢復工具在解碼器和碼流重新建立起同步後用來恢復丟棄的數據。這些工具不是簡單的用容錯碼恢復,而是用一種差錯迴避手段,即用可逆VLC碼字進行VLC編碼。錯誤隱藏,在重同步有效地將錯誤定位後可以很容易處理。為了進一步提高錯誤隱匿的能力,有必要增加錯誤定位能力,特別是數據分割可以用來提高錯誤定位能力。
總之,為了滿足各種應用的需求,MPEG-4標準的使用范圍相當龐大,具有廣泛的適應性和可擴展性。 全名VC-1視訊編解碼器(Video Codec 1),是微軟所開發的視訊編解碼系統。VC-1是最後被認可的高清編碼格式,不過因為有微軟的後台,所以這種編碼格式不能小窺。相對於MPEG2,VC-1的壓縮比更高,但相對於H.264而言,編碼解碼的計算則要稍小一些。目前來看,VC-1可能是一個比較好的平衡,一般一部1080p長120分鍾的電影大概在26G左右。
5. 數字視頻的文件格式有哪些
1、AVI文件。
2、FLIC文件。
3、MOV文件。
4、MPEG文件。
5。DAT格式 6.RM。
它採用了有損壓縮方法,從而減少運動圖像中的冗餘信息。MPEG的壓縮方法說的更加深入一點就是保留相鄰兩幅畫面絕大多數相同的部分,而把後續圖像中和前面圖像有冗餘的部分去除。
從而達到壓縮的目的。目前MPEG主要壓縮標准有MPEG-1、MPEG-2、MPEG-4、MPEG-7與MPEG-21。
(5)數字視頻壓縮標准擴展閱讀:
視頻圖像數據包含大量的冗餘信息。使用特定的編碼技術,改變一些不太重要的像素值,就可以大大減小視頻文件的存儲空間,通過在用戶忍耐范圍內損失一些清晰度。
可以把視頻壓縮到原大小的十分之一、百分之一甚至千分之一。正是以損失清晰度換取壓縮效果這一視頻數據處理領域具有革命性的設計思想,催生了如今百花齊放的視頻編碼格式。
在互聯網上被廣泛應用的還有RealNetworks的RealVideo系列標准、微軟公司的WMT標准以及蘋果公司的QuickTime標准等。目前常見的大部分視頻文件都是按照上述編碼標准生成的。
6. 視頻編碼的國標標準是
視頻編碼標準是主要應用於實時視頻通信領域,如會議電視;MPEG系列標準是由ISO/IEC制定的,主要應用於視頻存儲(DVD)、廣播電視、網際網路或無線網上的流媒體等。
數字視頻技術廣泛應用於通信、計算機、廣播電視等領域,帶來了會議電視、可視電話及數字電視、媒體存儲等一系列應用,促使了許多視頻編碼標準的產生。
ITU-T與ISO/IEC是制定視頻編碼標準的兩大組織,ITU-T的標准包括H.261、H.263、H.264,兩個組織也共同制定了一些標准,H.262標准等同於MPEG-2的視頻編碼標准,而最新的H.264標准則被納入MPEG-4的第10部分。
常見視頻格式
1、AVI格式
它的英文全稱為Audio Video Interleaved,即音頻視頻交錯格式。它於1992年被Microsoft公司推出,隨Windows3.1一起被人們所認識和熟知。所謂「音頻視頻交錯」,就是可以將視頻和音頻交織在一起進行同步播放。
這種視頻格式的優點是圖像質量好,可以跨多個平台使用,但是其缺點是體積過於龐大,而且更加糟糕的是壓縮標准不統一,因此經常會遇到高版本Windows媒體播放器播放不了採用早期編碼編輯的AVI格式視頻,而低版本Windows媒體播放器又播放不了採用最新編碼編輯的AVI格式視頻。
其實解決的方法也非常簡單,我們將在後面的視頻轉換、視頻修復部分中給出解決的方案。
2、DV-AVI格式
DV的英文全稱是Digital Video Format,是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。非常流行的數碼攝像機就是使用這種格式記錄視頻數據的。
它可以通過電腦的IEEE 1394埠傳輸視頻數據到電腦,也可以將電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般也是.avi,所以我們習慣地叫它為DV-AVI格式。
7. 衛星數字電視和新一代數字視盤DVD採用______作為數字視頻壓縮標准
MPEG-2
該標準是:針對標准數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,編碼碼率從每秒3兆比特~100兆比特,標準的正式規范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標准。MPEG-2還專門規定了多路節目的復分接方式。此外,MPEG-2還兼顧了與ATM信元的適配問題。
8. 音頻視頻壓縮技術概述
數字技術的出現與應用為人類帶來了深遠的影響,人們如今已生活在一個幾乎數字化的世界之中,而數字音頻技術則稱得上是應用最為廣泛的數字技術之一,CD、 VCD等早已走進千家萬戶,數字化廣播正在全球范圍內逐步得到開展,正是這些與廣大消費者密切相關的產品及應用成為了本文將要介紹的主題:數字音頻壓縮技術得以產生和發展的動力。
1、音頻壓縮技術的出現及早期應用
音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數字信號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的雜訊和一定的失真。
數字信號的優勢是顯而易見的,而它也有自身相應的缺點,即存儲容量需求的增加及傳輸時信道容量要求的增加。以CD為例,其采樣率為44.1KHz,量化精度為16比特,則1分鍾的立體聲音頻信號需占約10M位元組的存儲容量,也就是說,一張CD唱盤的容量只有1小時左右。當然,在帶寬高得多的數字視頻領域這一問題就顯得更加突出。是不是所有這些比特都是必需的呢?研究發現,直接採用PCM碼流進行存儲和傳輸存在非常大的冗餘度。事實上,在無損的條件下對聲音至少可進行4:1壓縮,即只用25%的數字量保留所有的信息,而在視頻領域壓縮比甚至可以達到幾百倍。因而,為利用有限的資源,壓縮技術從一出現便受到廣泛的重視。
對音頻壓縮技術的研究和應用由來已久,如A律、u律編碼就是簡單的准瞬時壓擴技術,並在ISDN話音傳輸中得到應用。對語音信號的研究發展較早,也較為成熟,並已得到廣泛應用,如自適應差分PCM(ADPCM)、線性預測編碼(LPC)等技術。在廣播領域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬時壓擴音頻復用)等系統中都使用了音頻壓縮技術。
2、音頻壓縮演算法的主要分類及典型代表
一般來講,可以將音頻壓縮技術分為無損(lossless)壓縮及有損(lossy)壓縮兩大類,而按照壓縮方案的不同,又可將其劃分為時域壓縮、變換壓縮、子帶壓縮,以及多種技術相互融合的混合壓縮等等。各種不同的壓縮技術,其演算法的復雜程度(包括時間復雜度和空間復雜度)、音頻質量、演算法效率(即壓縮比例),以及編解碼延時等都有很大的不同。各種壓縮技術的應用場合也因之而各不相同。
(1)時域壓縮(或稱為波形編碼)技術是指直接針對音頻PCM碼流的樣值進行處理,通過靜音檢測、非線性量化、差分等手段對碼流進行壓縮。此類壓縮技術的共同特點是演算法復雜度低,聲音質量一般,壓縮比小(CD音質> 400kbps),編解碼延時最短(相對其它技術)。此類壓縮技術一般多用於語音壓縮,低碼率應用(源信號帶寬小)的場合。時域壓縮技術主要包括 G.711、ADPCM、LPC、CELP,以及在這些技術上發展起來的塊壓擴技術如NICAM、子帶ADPCM(SB-ADPCM)技術如G.721、 G.722、Apt-X等。
(2)子帶壓縮技術是以子帶編碼理論為基礎的一種編碼方法。子帶編碼理論最早是由Crochiere等於1976年提出的。其基本思想是將信號分解為若乾子頻帶內的分量之和,然後對各子帶分量根據其不同的分布特性採取不同的壓縮策略以降低碼率。通常的子帶壓縮技術和下面介紹的變換壓縮技術都是根據人對聲音信號的感知模型(心理聲學模型),通過對信號頻譜的分析來決定子帶樣值或頻域樣值的量化階數和其它參數選擇的,因此又可稱為感知型(Perceptual)壓縮編碼。這兩種壓縮方式相對時域壓縮技術而言要復雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。一般來講,子帶編碼的復雜度要略低於變換編碼,編碼延時也相對較短。
由於在子帶壓縮技術中主要應用了心理聲學中的聲音掩蔽模型,因而在對信號進行壓縮時引入了大量的量化雜訊。然而,根據人類的聽覺掩蔽曲線,在解碼後,這些雜訊被有用的聲音信號掩蔽掉了,人耳無法察覺;同時由於子帶分析的運用,各頻帶內的雜訊將被限制在頻帶內,不會對其它頻帶的信號產生影響。因而在編碼時各子帶的量化階數不同,採用了動態比特分配技術,這也正是此類技術壓縮效率高的主要原因。在一定的碼率條件下,此類技術可以達到「完全透明」的聲音質量(EBU音質標准)。
子帶壓縮技術目前廣泛應用於數字聲音節目的存儲與製作和數字化廣播中。典型的代表有著名的MPEG-1層Ⅰ、層Ⅱ(MUSICAM),以及用於Philips DCC中的PASC(Precision Adaptive Subband Coding,精確自適應子帶編碼)等。
(3)變換壓縮技術與子帶壓縮技術的不同之處在於該技術對一段音頻數據進行「線性」的變換,對所獲得的變換域參數進行量化、傳輸,而不是把信號分解為幾個子頻段。通常使用的變換有DFT、DCT(離散餘弦變換)、MDCT等。根據信號的短時功率譜對變換域參數進行合理的動態比特分配可以使音頻質量獲得顯著改善,而相應付出的代價則是計算復雜度的提高。
變換域壓縮具有一些不完善之處,如塊邊界影響、預回響、低碼率時聲音質量嚴重下降等。然而隨著技術的不斷進步,這些缺陷正逐步被消除,同時在許多新的壓縮編碼技術中也大量採用了傳統變換編碼的某些技術。
有代表性的變換壓縮編碼技術有DolbyAC-2、AT&T的ASPEC(Audio Spectral Perceptual Entropy Coding)、PAC(PerceptualAudioCoder)等。
3、音頻壓縮技術的標准化和MPEG-1
由於數字音頻壓縮技術具有廣闊的應用范圍和良好的市場前景,因而一些著名的研究機構和大公司都不遺餘力地開發自己的專利技術和產品。這些音頻壓縮技術的標准化工作就顯得十分重要。CCITT(現ITU-T)在語音信號壓縮的標准化方面做了大量的工作,制訂了如G.711、G.721、G.728等標准,並逐漸受到業界的認同。
在音頻壓縮標准化方面取得巨大成功的是MPEG-1音頻(ISO/IEC11172-3)。在MPEG-1中,對音頻壓縮規定了三種模式,即層Ⅰ、層Ⅱ(即MUSICAM,又稱MP2),層Ⅲ(又稱MP3)。由於在制訂標准時對許多壓縮技術進行了認真的考察,並充分考慮了實際應用條件和演算法的可實現性(復雜度),因而三種模式都得到了廣泛的應用。VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ;而MUSICAM由於其適當的復雜程度和優秀的聲音質量,在數字演播室、DAB、DVB等數位元組目的製作、交換、存儲、傳送中得到廣泛應用;MP3是在綜合MUSICAM和ASPEC的優點的基礎上提出的混合壓縮技術,在當時的技術條件下,MP3的復雜度顯得相對較高,編碼不利於實時,但由於MP3在低碼率條件下高水準的聲音質量,使得它成為軟解壓及網路廣播的寵兒。可以說,MPEG-1音頻標準的制訂方式決定了它的成功,這一思路甚至也影響到後面將要談到的MPEG-2和MPEG-4音頻標準的制訂。
最新進展
1、多聲道音頻信號壓縮與DolbyAC-3
隨著技術的不斷進步和生活水準的不斷提高,原有的立體聲形式已不能滿足受眾對聲音節目的欣賞要求,具有更強定位能力和空間效果的三維聲音技術得到蓬勃發展。而在三維聲音技術中最具代表性的就是多聲道環繞聲技術。
更准確地說,環繞聲應該是一種聲音恢復形式,其新技術的含量實際表現在隨著這種形式發展起來的一些數字壓縮標准上。環繞聲技術發展至今已相當成熟,已日漸成為未來聲音形式的主流。有鑒於此,1992年CCIR(ITU-R)以建議的形式約定了多聲道聲音系統的結構及向下兼容變換的標准,即CCIR Recommendation 775。其中主要約定了大家熟知的5.1聲道形式及7.1聲道形式,而在對環繞聲壓縮的研究上也產生了許多專利技術,如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。這些技術在不同的場合,尤其是在影劇院、家庭影院系統,及將來的高清晰度電視(HDTV)等系統中得到廣泛的應用。
(1)Dolby AC-3技術是由美國杜比實驗室主要針對環繞聲開發的一種音頻壓縮技術。在5.1聲道的條件下,可將碼率壓縮至384kbps,壓縮比約為10:1。Dolby AC-3最初是針對影院系統開發的,但目前已成為應用最為廣泛的環繞聲壓縮技術之一。
Dolby AC-3是一種感知型壓縮編碼技術。
在Dolby AC-3中,音頻輸入以音頻塊為單位,塊長度為512個樣值,在48KHz采樣率時即為10.66毫秒,各聲道單獨處理;音頻輸入在經過3Hz高通濾波器去除直流成分後,通過另一高頻帶通濾波器以檢測信號的瞬變情況,並用它來控制TDAC變換的長度,以期在頻域解析度和時域解析度之間得到最好的折中效果; TDAC變換的長度一般為512點,而數據塊之間的重疊長度為256點,即TDAC每5.33毫秒進行一次;在瞬變條件下,TDAC長度被等分為256 點,這樣DolbyAC-3的頻域解析度為93.75Hz,時域最小解析度為2.67毫秒;在圖1中的定點/浮點轉換類似於MPEG-1中比例因子計算的作用,主要是為了獲得寬的動態范圍,而在分離後的指數部分經編碼後則構成了整個信號大致的頻譜,又被稱為頻譜包絡;比特分配主要是通過計算解碼後的頻譜包絡(視為功率譜密度)和掩蔽曲線的相關性來進行的;由於比特分配中採用了前/後向混合自適應比特分配以及公共比特池等技術,因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對尾數的量化過程中,可對尾數進行抖晃處理,抖晃所使用的偽隨機數發生器可在不同的平台上獲得相同的結果;AC -3的幀結構由同步字、CRC、同步信息(SI)、碼流信息(BSI)、音頻塊和附加數據等組成,幀長度與TDAC變換的長度有關,在長度為512點時,幀長為32毫秒,即每秒31.25幀。
通過以上敘述可見,在Dolby AC-3中,使用了許多先進的、行之有效的壓縮技術。如前/後向混合自適應比特分配、公共比特池、TDAC濾波、頻譜包絡編碼、及低碼率條件下使用的多聲道高頻耦合等。而其中許多技術對其它的多聲道環繞聲壓縮技術的發展都產生了一定的影響。
可以說,AC-3的出現是杜比公司幾十年來在聲音降噪及編碼技術方面的結晶(從一定的角度來看,編碼技術實際上就是降低編碼雜訊影響的技術),在技術上它具有很強的優勢。因而即使作為一項專利技術,DolbyAC-3仍然在影院系統、HDTV、消費類電子產品(如LD、DVD)及直播衛星等方面獲得了廣泛的應用,得到了眾多廠商的支持,成為業界事實上的標准。
(2)MPEG-2BC(後向兼容方式),即ISO/IEC13818- 3,是另一種多聲道環繞聲音頻壓縮技術。早在1992年初,該方面的討論工作便已初步開展,並於94年11月正式獲得通過。MPEG-2BC主要是在 MPEG-1和CCIRRec.775的基礎上發展起來的。與MPEG-1相比較,MPEG-2BC主要在兩方面做了重大改進。一是支持多聲道聲音形式,二是為某些低碼率應用場合,如多語聲節目、體育比賽解說等而進行的低采樣率擴展。同時,標准規定的碼流形式還可與MPEG-1的第1和第2層做到前、後向兼容,並可依據CCIR Rec.775做到與雙聲道、單聲道形式的向下兼容,還能夠與Dolby Surround形式兼容。
在MPEG-2BC中,由於考慮到其前、後向兼容性以及環繞聲音形式的新特點,在壓縮演算法中除承襲了MPEG-1的絕大部分技術外,為在低碼率條件下進一步提高聲音質量,還採用了多種新技術。如動態傳輸通道切換、動態串音、自適應多聲道預測、中央聲道部分編碼(Phantom Coding of Center)、預編碼(Predistortion)等。
然而,MPEG-2BC的發展和應用並不如MPEG-1那樣一帆風順。通過對一些相關論文的比較可以發現,MPEG-2BC的編碼框圖在標准化過程中發生了重大的變化,上述的許多新技術都是在後期引入的。事實上,正是與 MPEG-1的前、後向兼容性成為MPEG-2BC最大的弱點,使得MPEG-2BC不得不以犧牲碼率的代價來換取較好的聲音質量。一般情況下,MPEG -2BC需640kbps以上的碼率才能基本達到EBU「無法區分」聲音質量要求。由於MPEG-2BC標准化的進程過快,其演算法自身仍存在一些缺陷。這一切都成為MPEG-2BC在世界范圍內得到廣泛應用的障礙。
(3)DVD(DigitalVersatileDisk)是新一代的多媒體數據存儲和交換的標准。在視頻DVD的伴音方式及音頻DVD的聲音格式選擇上,AC-3和MPEG-2BC之間的爭奪十分激烈,最後達成的協議如表1 所示。可見,多聲道環繞聲音頻壓縮技術標准亟待統一。
9. 數字視頻由於壓縮標准不同,有MPEG、RMVB、FLV......等多種格式,格式轉換工具+
摘要 https://www.wandoujia.com/apps/8116342?utm_source=wap&utm_medium=cpc&utm_campaign=jrtt
10. 目前DVD光碟上存儲的數字視頻採用的壓縮編碼標准
DVD採用了MPEG-2數字壓縮編碼標准。
1、MPEG-2是一種以提高圖像質量為目標的通用國際編碼標准。MPEG-2建立在MPEG-1的基礎上,擴充了以場為基礎的運動補償,旨在消除運動圖像時間和空間上的冗餘。
2、MPEG-2壓縮方案的比特率可以從1.5Mbps到40Mbps,比特率越高,每幀所分配的比特就越多,圖像質量就越高。為了在一張4.7G位元組碟片存儲133分鍾的電影,平均MPEG-2視頻比特率可以達到10Mbps。
3、為了優化圖像質量,MPEG-2採用了變比特率(VBR)編碼方案。