㈠ 音頻視頻壓縮技術概述
數字技術的出現與應用為人類帶來了深遠的影響,人們如今已生活在一個幾乎數字化的世界之中,而數字音頻技術則稱得上是應用最為廣泛的數字技術之一,CD、 VCD等早已走進千家萬戶,數字化廣播正在全球范圍內逐步得到開展,正是這些與廣大消費者密切相關的產品及應用成為了本文將要介紹的主題:數字音頻壓縮技術得以產生和發展的動力。
1、音頻壓縮技術的出現及早期應用
音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數字信號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的雜訊和一定的失真。
數字信號的優勢是顯而易見的,而它也有自身相應的缺點,即存儲容量需求的增加及傳輸時信道容量要求的增加。以CD為例,其采樣率為44.1KHz,量化精度為16比特,則1分鍾的立體聲音頻信號需占約10M位元組的存儲容量,也就是說,一張CD唱盤的容量只有1小時左右。當然,在帶寬高得多的數字視頻領域這一問題就顯得更加突出。是不是所有這些比特都是必需的呢?研究發現,直接採用PCM碼流進行存儲和傳輸存在非常大的冗餘度。事實上,在無損的條件下對聲音至少可進行4:1壓縮,即只用25%的數字量保留所有的信息,而在視頻領域壓縮比甚至可以達到幾百倍。因而,為利用有限的資源,壓縮技術從一出現便受到廣泛的重視。
對音頻壓縮技術的研究和應用由來已久,如A律、u律編碼就是簡單的准瞬時壓擴技術,並在ISDN話音傳輸中得到應用。對語音信號的研究發展較早,也較為成熟,並已得到廣泛應用,如自適應差分PCM(ADPCM)、線性預測編碼(LPC)等技術。在廣播領域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬時壓擴音頻復用)等系統中都使用了音頻壓縮技術。
2、音頻壓縮演算法的主要分類及典型代表
一般來講,可以將音頻壓縮技術分為無損(lossless)壓縮及有損(lossy)壓縮兩大類,而按照壓縮方案的不同,又可將其劃分為時域壓縮、變換壓縮、子帶壓縮,以及多種技術相互融合的混合壓縮等等。各種不同的壓縮技術,其演算法的復雜程度(包括時間復雜度和空間復雜度)、音頻質量、演算法效率(即壓縮比例),以及編解碼延時等都有很大的不同。各種壓縮技術的應用場合也因之而各不相同。
(1)時域壓縮(或稱為波形編碼)技術是指直接針對音頻PCM碼流的樣值進行處理,通過靜音檢測、非線性量化、差分等手段對碼流進行壓縮。此類壓縮技術的共同特點是演算法復雜度低,聲音質量一般,壓縮比小(CD音質> 400kbps),編解碼延時最短(相對其它技術)。此類壓縮技術一般多用於語音壓縮,低碼率應用(源信號帶寬小)的場合。時域壓縮技術主要包括 G.711、ADPCM、LPC、CELP,以及在這些技術上發展起來的塊壓擴技術如NICAM、子帶ADPCM(SB-ADPCM)技術如G.721、 G.722、Apt-X等。
(2)子帶壓縮技術是以子帶編碼理論為基礎的一種編碼方法。子帶編碼理論最早是由Crochiere等於1976年提出的。其基本思想是將信號分解為若乾子頻帶內的分量之和,然後對各子帶分量根據其不同的分布特性採取不同的壓縮策略以降低碼率。通常的子帶壓縮技術和下面介紹的變換壓縮技術都是根據人對聲音信號的感知模型(心理聲學模型),通過對信號頻譜的分析來決定子帶樣值或頻域樣值的量化階數和其它參數選擇的,因此又可稱為感知型(Perceptual)壓縮編碼。這兩種壓縮方式相對時域壓縮技術而言要復雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。一般來講,子帶編碼的復雜度要略低於變換編碼,編碼延時也相對較短。
由於在子帶壓縮技術中主要應用了心理聲學中的聲音掩蔽模型,因而在對信號進行壓縮時引入了大量的量化雜訊。然而,根據人類的聽覺掩蔽曲線,在解碼後,這些雜訊被有用的聲音信號掩蔽掉了,人耳無法察覺;同時由於子帶分析的運用,各頻帶內的雜訊將被限制在頻帶內,不會對其它頻帶的信號產生影響。因而在編碼時各子帶的量化階數不同,採用了動態比特分配技術,這也正是此類技術壓縮效率高的主要原因。在一定的碼率條件下,此類技術可以達到「完全透明」的聲音質量(EBU音質標准)。
子帶壓縮技術目前廣泛應用於數字聲音節目的存儲與製作和數字化廣播中。典型的代表有著名的MPEG-1層Ⅰ、層Ⅱ(MUSICAM),以及用於Philips DCC中的PASC(Precision Adaptive Subband Coding,精確自適應子帶編碼)等。
(3)變換壓縮技術與子帶壓縮技術的不同之處在於該技術對一段音頻數據進行「線性」的變換,對所獲得的變換域參數進行量化、傳輸,而不是把信號分解為幾個子頻段。通常使用的變換有DFT、DCT(離散餘弦變換)、MDCT等。根據信號的短時功率譜對變換域參數進行合理的動態比特分配可以使音頻質量獲得顯著改善,而相應付出的代價則是計算復雜度的提高。
變換域壓縮具有一些不完善之處,如塊邊界影響、預回響、低碼率時聲音質量嚴重下降等。然而隨著技術的不斷進步,這些缺陷正逐步被消除,同時在許多新的壓縮編碼技術中也大量採用了傳統變換編碼的某些技術。
有代表性的變換壓縮編碼技術有DolbyAC-2、AT&T的ASPEC(Audio Spectral Perceptual Entropy Coding)、PAC(PerceptualAudioCoder)等。
3、音頻壓縮技術的標准化和MPEG-1
由於數字音頻壓縮技術具有廣闊的應用范圍和良好的市場前景,因而一些著名的研究機構和大公司都不遺餘力地開發自己的專利技術和產品。這些音頻壓縮技術的標准化工作就顯得十分重要。CCITT(現ITU-T)在語音信號壓縮的標准化方面做了大量的工作,制訂了如G.711、G.721、G.728等標准,並逐漸受到業界的認同。
在音頻壓縮標准化方面取得巨大成功的是MPEG-1音頻(ISO/IEC11172-3)。在MPEG-1中,對音頻壓縮規定了三種模式,即層Ⅰ、層Ⅱ(即MUSICAM,又稱MP2),層Ⅲ(又稱MP3)。由於在制訂標准時對許多壓縮技術進行了認真的考察,並充分考慮了實際應用條件和演算法的可實現性(復雜度),因而三種模式都得到了廣泛的應用。VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ;而MUSICAM由於其適當的復雜程度和優秀的聲音質量,在數字演播室、DAB、DVB等數位元組目的製作、交換、存儲、傳送中得到廣泛應用;MP3是在綜合MUSICAM和ASPEC的優點的基礎上提出的混合壓縮技術,在當時的技術條件下,MP3的復雜度顯得相對較高,編碼不利於實時,但由於MP3在低碼率條件下高水準的聲音質量,使得它成為軟解壓及網路廣播的寵兒。可以說,MPEG-1音頻標準的制訂方式決定了它的成功,這一思路甚至也影響到後面將要談到的MPEG-2和MPEG-4音頻標準的制訂。
最新進展
1、多聲道音頻信號壓縮與DolbyAC-3
隨著技術的不斷進步和生活水準的不斷提高,原有的立體聲形式已不能滿足受眾對聲音節目的欣賞要求,具有更強定位能力和空間效果的三維聲音技術得到蓬勃發展。而在三維聲音技術中最具代表性的就是多聲道環繞聲技術。
更准確地說,環繞聲應該是一種聲音恢復形式,其新技術的含量實際表現在隨著這種形式發展起來的一些數字壓縮標准上。環繞聲技術發展至今已相當成熟,已日漸成為未來聲音形式的主流。有鑒於此,1992年CCIR(ITU-R)以建議的形式約定了多聲道聲音系統的結構及向下兼容變換的標准,即CCIR Recommendation 775。其中主要約定了大家熟知的5.1聲道形式及7.1聲道形式,而在對環繞聲壓縮的研究上也產生了許多專利技術,如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。這些技術在不同的場合,尤其是在影劇院、家庭影院系統,及將來的高清晰度電視(HDTV)等系統中得到廣泛的應用。
(1)Dolby AC-3技術是由美國杜比實驗室主要針對環繞聲開發的一種音頻壓縮技術。在5.1聲道的條件下,可將碼率壓縮至384kbps,壓縮比約為10:1。Dolby AC-3最初是針對影院系統開發的,但目前已成為應用最為廣泛的環繞聲壓縮技術之一。
Dolby AC-3是一種感知型壓縮編碼技術。
在Dolby AC-3中,音頻輸入以音頻塊為單位,塊長度為512個樣值,在48KHz采樣率時即為10.66毫秒,各聲道單獨處理;音頻輸入在經過3Hz高通濾波器去除直流成分後,通過另一高頻帶通濾波器以檢測信號的瞬變情況,並用它來控制TDAC變換的長度,以期在頻域解析度和時域解析度之間得到最好的折中效果; TDAC變換的長度一般為512點,而數據塊之間的重疊長度為256點,即TDAC每5.33毫秒進行一次;在瞬變條件下,TDAC長度被等分為256 點,這樣DolbyAC-3的頻域解析度為93.75Hz,時域最小解析度為2.67毫秒;在圖1中的定點/浮點轉換類似於MPEG-1中比例因子計算的作用,主要是為了獲得寬的動態范圍,而在分離後的指數部分經編碼後則構成了整個信號大致的頻譜,又被稱為頻譜包絡;比特分配主要是通過計算解碼後的頻譜包絡(視為功率譜密度)和掩蔽曲線的相關性來進行的;由於比特分配中採用了前/後向混合自適應比特分配以及公共比特池等技術,因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對尾數的量化過程中,可對尾數進行抖晃處理,抖晃所使用的偽隨機數發生器可在不同的平台上獲得相同的結果;AC -3的幀結構由同步字、CRC、同步信息(SI)、碼流信息(BSI)、音頻塊和附加數據等組成,幀長度與TDAC變換的長度有關,在長度為512點時,幀長為32毫秒,即每秒31.25幀。
通過以上敘述可見,在Dolby AC-3中,使用了許多先進的、行之有效的壓縮技術。如前/後向混合自適應比特分配、公共比特池、TDAC濾波、頻譜包絡編碼、及低碼率條件下使用的多聲道高頻耦合等。而其中許多技術對其它的多聲道環繞聲壓縮技術的發展都產生了一定的影響。
可以說,AC-3的出現是杜比公司幾十年來在聲音降噪及編碼技術方面的結晶(從一定的角度來看,編碼技術實際上就是降低編碼雜訊影響的技術),在技術上它具有很強的優勢。因而即使作為一項專利技術,DolbyAC-3仍然在影院系統、HDTV、消費類電子產品(如LD、DVD)及直播衛星等方面獲得了廣泛的應用,得到了眾多廠商的支持,成為業界事實上的標准。
(2)MPEG-2BC(後向兼容方式),即ISO/IEC13818- 3,是另一種多聲道環繞聲音頻壓縮技術。早在1992年初,該方面的討論工作便已初步開展,並於94年11月正式獲得通過。MPEG-2BC主要是在 MPEG-1和CCIRRec.775的基礎上發展起來的。與MPEG-1相比較,MPEG-2BC主要在兩方面做了重大改進。一是支持多聲道聲音形式,二是為某些低碼率應用場合,如多語聲節目、體育比賽解說等而進行的低采樣率擴展。同時,標准規定的碼流形式還可與MPEG-1的第1和第2層做到前、後向兼容,並可依據CCIR Rec.775做到與雙聲道、單聲道形式的向下兼容,還能夠與Dolby Surround形式兼容。
在MPEG-2BC中,由於考慮到其前、後向兼容性以及環繞聲音形式的新特點,在壓縮演算法中除承襲了MPEG-1的絕大部分技術外,為在低碼率條件下進一步提高聲音質量,還採用了多種新技術。如動態傳輸通道切換、動態串音、自適應多聲道預測、中央聲道部分編碼(Phantom Coding of Center)、預編碼(Predistortion)等。
然而,MPEG-2BC的發展和應用並不如MPEG-1那樣一帆風順。通過對一些相關論文的比較可以發現,MPEG-2BC的編碼框圖在標准化過程中發生了重大的變化,上述的許多新技術都是在後期引入的。事實上,正是與 MPEG-1的前、後向兼容性成為MPEG-2BC最大的弱點,使得MPEG-2BC不得不以犧牲碼率的代價來換取較好的聲音質量。一般情況下,MPEG -2BC需640kbps以上的碼率才能基本達到EBU「無法區分」聲音質量要求。由於MPEG-2BC標准化的進程過快,其演算法自身仍存在一些缺陷。這一切都成為MPEG-2BC在世界范圍內得到廣泛應用的障礙。
(3)DVD(DigitalVersatileDisk)是新一代的多媒體數據存儲和交換的標准。在視頻DVD的伴音方式及音頻DVD的聲音格式選擇上,AC-3和MPEG-2BC之間的爭奪十分激烈,最後達成的協議如表1 所示。可見,多聲道環繞聲音頻壓縮技術標准亟待統一。
㈡ 用什麼軟體可以把聲音和動畫合在一起
為了保證兼容性,建議你使用WAV格式保存音頻文件。在編輯過程中,音頻與視頻文件往往是互相獨立的,但是為了便於使用,我們必須將其合並,此時MPEG 編碼軟體中的泰山北斗TMPGEnc自然是當仁不讓的首選。
在TMPGEnc的主界面分別選擇Video Source與Audio Source,然後確定輸出路徑,再把Stream Type選定為System(Video+Audio)。單擊Setting按鈕,在彈出的對話框中將Stream Type選定為MPEG1,並且Aspect ratio為4:3 PAL,其它選項不必更改。
點擊OK按鈕之後回到主界面,按下左上角的Start按鈕即可開始合並,最終得到完整的MPEG1視頻文件,並進行VCD光碟刻錄。
網上看到的借花來獻獻,嘿嘿!!!!!!!!!希望表找我麻煩
㈢ 為什麼我從壓縮包解壓的視頻只有聲音沒有畫面重新下載也還是一樣,怎麼辦求解!
能解開播放說明壓縮包沒問題,換個播放軟體試一下,就是缺解碼器
㈣ 3378多媒體信息不包括 ( ) A.音頻、視頻 B,文字、動畫 C. 音效卡、解壓卡 D.聲音、圖形
C音效卡、解壓卡
解釋:
音效卡、解壓卡屬於硬體技術,不是多媒體信息。
相關介紹:
1.音效卡:
音效卡是多媒體技術中最基本的組成部分,是實現聲波/數字信號相互轉換的一種硬體。
2.解壓卡:
可稱之為DVD解壓卡,其主要的作用是解壓輸出視頻文件的圖像與聲音。解壓卡主要是用在KTV點歌系統、電視台節目輸出以及一些視頻圖像回放領域的。
(4)聲音解壓視頻動畫擴展閱讀
相關背景:
音效卡由各種電子器件和連接器組成。電子器件用來完成各種特定的功能。連接器一般有插座和圓形插孔兩種,用來連接輸入輸出信號。
數字聲音文件。通過音效卡及相應的驅動程序的控制,採集來自話筒、收錄機等音源的信號,壓縮後被存放在計算機系統的內存或硬碟中。激光碟壓縮的數字化聲音文件還原成高質量的聲音信號,放大後通過揚聲器放出。
數字化的聲音文件進行加工,以達到某一特定的音頻效果。
參考資料來源:網路-音效卡
參考資料來源:網路-解壓卡
㈤ 求教,怎麼解壓下來的視頻文件只有聲音而沒有圖像呢
調整你的播放軟體,比如裝個暴風影音試試
㈥ 視頻壓縮後只有聲音沒有圖像的問題
可能是由於軟體本身缺少編解碼或者是解碼器限制的問題導致的,建議用另外一款軟體重新轉換試試。
想要轉換質量好的話,推薦用MP4/RM轉換專家,支持將幾乎所有視頻格式的導入,轉換質量和速度都很好。
還可以在轉換之前把視頻比特率參數設置高一點,比特率越高轉換出來文件就越加清晰了。
參考資料:http://www.ote.com/soft/437.html
㈦ 視頻的壓縮軟體可以壓縮聲音嗎
首先你要明白音軌是什麼,常用的有哪些音頻格式,請查下資料自然就知道答案了。
懶得查的話直接告訴你答案:聲音可以壓縮。只是平時接觸的音頻都是壓縮格式了,一般不需再壓縮了。
天天靜聽最常用吧?也可把它當成一個簡單的音頻壓縮軟體來用。
㈧ 解壓出來的視頻只有聲音沒有畫面
咨詢記錄 · 回答於2021-11-17
㈨ 壓縮視頻文件對視頻會有影響嗎
會有影響,會造成視頻畫質的降低。
壓縮視頻是對視頻本身的大小聲音或畫質進行犧牲來實現視頻文件的變小。
壓縮過程中如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。
(9)聲音解壓視頻動畫擴展閱讀
未壓縮過的視頻常常是不實用的。在數字圖像監控系統中,需要處理大量的視頻數據,因而圖像的壓縮編碼和解碼顯得十分重要。現在已有多種壓縮方法用於數字監控系統,目前比較普遍使用的有JPEG(對單幅圖像)、H .261(P ×64 )、MPEG(用於視頻用於視頻和音頻)。
對於有損壓縮,在文件壓縮將無法復原成原始文件的樣子。壓縮程序會對對原始文件重新解釋。因此,如果需要完全重現原來的內容(例如軟體應用程序、資料庫),則不應該使用這種壓縮形式。