A. matlab程序問題
你肯定沒用過imwrite 你隨便這么imwrite試試就會發現全是白色 因為你沒轉換類型
倒數第2行加上A=uint8(A);
順便說句A=imread('jiuzaigou.bmp');A=im2double(A);
可以改寫成OriName='jiuzaigou.bmp';A=double(imread(OriName));
最後改成 DesName='tupian.jpg';imwrite(A,DesName);更標准些
B. 機器學習實戰的作品目錄
目錄第一部分分類第1章機器學習基礎21.1 何謂機器學習31.1.1 感測器和海量數據41.1.2 機器學習非常重要51.2 關鍵術語51.3 機器學習的主要任務71.4 如何選擇合適的演算法81.5 開發機器學習應用程序的步驟91.6 Python語言的優勢101.6.1 可執行偽代碼101.6.2 Python比較流行101.6.3 Python語言的特色111.6.4 Python語言的缺點111.7 NumPy函數庫基礎121.8 本章小結13第2章k-近鄰演算法 152.1 k-近鄰演算法概述152.1.1 准備:使用Python導入數據172.1.2 從文本文件中解析數據192.1.3 如何測試分類器202.2 示例:使用k-近鄰演算法改進約會網站的配對效果202.2.1 准備數據:從文本文件中解析數據212.2.2 分析數據:使用Matplotlib創建散點圖232.2.3 准備數據:歸一化數值252.2.4 測試演算法:作為完整程序驗證分類器262.2.5 使用演算法:構建完整可用系統272.3 示例:手寫識別系統282.3.1 准備數據:將圖像轉換為測試向量292.3.2 測試演算法:使用k-近鄰演算法識別手寫數字302.4 本章小結31第3章決策樹 323.1 決策樹的構造333.1.1 信息增益353.1.2 劃分數據集373.1.3 遞歸構建決策樹393.2 在Python中使用Matplotlib註解繪制樹形圖423.2.1 Matplotlib註解433.2.2 構造註解樹443.3 測試和存儲分類器483.3.1 測試演算法:使用決策樹執行分類493.3.2 使用演算法:決策樹的存儲503.4 示例:使用決策樹預測隱形眼鏡類型503.5 本章小結52第4章基於概率論的分類方法:樸素貝葉斯 534.1 基於貝葉斯決策理論的分類方法534.2 條件概率554.3 使用條件概率來分類564.4 使用樸素貝葉斯進行文檔分類574.5 使用Python進行文本分類584.5.1 准備數據:從文本中構建詞向量584.5.2 訓練演算法:從詞向量計算概率604.5.3 測試演算法:根據現實情況修改分類器624.5.4 准備數據:文檔詞袋模型644.6 示例:使用樸素貝葉斯過濾垃圾郵件644.6.1 准備數據:切分文本654.6.2 測試演算法:使用樸素貝葉斯進行交叉驗證664.7 示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向684.7.1 收集數據:導入RSS源684.7.2 分析數據:顯示地域相關的用詞714.8 本章小結72第5章Logistic回歸 735.1 基於Logistic回歸和Sigmoid函數的分類745.2 基於最優化方法的最佳回歸系數確定755.2.1 梯度上升法755.2.2 訓練演算法:使用梯度上升找到最佳參數775.2.3 分析數據:畫出決策邊界795.2.4 訓練演算法:隨機梯度上升805.3 示例:從疝氣病症預測病馬的死亡率855.3.1 准備數據:處理數據中的缺失值855.3.2 測試演算法:用Logistic回歸進行分類865.4 本章小結88第6章支持向量機896.1 基於最大間隔分隔數據896.2 尋找最大間隔916.2.1 分類器求解的優化問題926.2.2 SVM應用的一般框架936.3 SMO高效優化演算法946.3.1 Platt的SMO演算法946.3.2 應用簡化版SMO演算法處理小規模數據集946.4 利用完整Platt SMO演算法加速優化996.5 在復雜數據上應用核函數1056.5.1 利用核函數將數據映射到高維空間1066.5.2 徑向基核函數1066.5.3 在測試中使用核函數1086.6 示例:手寫識別問題回顧1116.7 本章小結113第7章利用AdaBoost元演算法提高分類性能 1157.1 基於數據集多重抽樣的分類器1157.1.1 bagging:基於數據隨機重抽樣的分類器構建方法1167.1.2 boosting1167.2 訓練演算法:基於錯誤提升分類器的性能1177.3 基於單層決策樹構建弱分類器1187.4 完整AdaBoost演算法的實現1227.5 測試演算法:基於AdaBoost的分類1247.6 示例:在一個難數據集上應用AdaBoost1257.7 非均衡分類問題1277.7.1 其他分類性能度量指標:正確率、召回率及ROC曲線1287.7.2 基於代價函數的分類器決策控制1317.7.3 處理非均衡問題的數據抽樣方法1327.8 本章小結132第二部分利用回歸預測數值型數據第8章預測數值型數據:回歸 1368.1 用線性回歸找到最佳擬合直線1368.2 局部加權線性回歸1418.3 示例:預測鮑魚的年齡1458.4 縮減系數來「理解」數據1468.4.1 嶺回歸1468.4.2 lasso1488.4.3 前向逐步回歸1498.5 權衡偏差與方差1528.6 示例:預測樂高玩具套裝的價格1538.6.1 收集數據:使用Google購物的API1538.6.2 訓練演算法:建立模型1558.7 本章小結158第9章樹回歸1599.1 復雜數據的局部性建模1599.2 連續和離散型特徵的樹的構建1609.3 將CART演算法用於回歸1639.3.1 構建樹1639.3.2 運行代碼1659.4 樹剪枝1679.4.1 預剪枝1679.4.2 後剪枝1689.5 模型樹1709.6 示例:樹回歸與標准回歸的比較1739.7 使用Python的Tkinter庫創建GUI1769.7.1 用Tkinter創建GUI1779.7.2 集成Matplotlib和Tkinter1799.8 本章小結182第三部分無監督學習第10章利用K-均值聚類演算法對未標注數據分組18410.1 K-均值聚類演算法18510.2 使用後處理來提高聚類性能18910.3 二分K-均值演算法19010.4 示例:對地圖上的點進行聚類19310.4.1 Yahoo! PlaceFinder API19410.4.2 對地理坐標進行聚類19610.5 本章小結198第11章使用Apriori演算法進行關聯分析20011.1 關聯分析20111.2 Apriori原理20211.3 使用Apriori演算法來發現頻繁集20411.3.1 生成候選項集20411.3.2 組織完整的Apriori演算法20711.4 從頻繁項集中挖掘關聯規則20911.5 示例:發現國會投票中的模式21211.5.1 收集數據:構建美國國會投票記錄的事務數據集21311.5.2 測試演算法:基於美國國會投票記錄挖掘關聯規則21911.6 示例:發現毒蘑菇的相似特徵22011.7 本章小結221第12章使用FP-growth演算法來高效發現頻繁項集22312.1 FP樹:用於編碼數據集的有效方式22412.2 構建FP樹22512.2.1 創建FP樹的數據結構22612.2.2 構建FP樹22712.3 從一棵FP樹中挖掘頻繁項集23112.3.1 抽取條件模式基23112.3.2 創建條件FP樹23212.4 示例:在Twitter源中發現一些共現詞23512.5 示例:從新聞網站點擊流中挖掘23812.6 本章小結239第四部分其他工具第13章利用PCA來簡化數據24213.1 降維技術24213.2 PCA24313.2.1 移動坐標軸24313.2.2 在NumPy中實現PCA24613.3 示例:利用PCA對半導體製造數據降維24813.4 本章小結251第14章利用SVD簡化數據25214.1 SVD的應用25214.1.1 隱性語義索引25314.1.2 推薦系統25314.2 矩陣分解25414.3 利用Python實現SVD25514.4 基於協同過濾的推薦引擎25714.4.1 相似度計算25714.4.2 基於物品的相似度還是基於用戶的相似度?26014.4.3 推薦引擎的評價26014.5 示例:餐館菜餚推薦引擎26014.5.1 推薦未嘗過的菜餚26114.5.2 利用SVD提高推薦的效果26314.5.3 構建推薦引擎面臨的挑戰26514.6 基於SVD的圖像壓縮26614.7 本章小結268第15章大數據與MapRece27015.1 MapRece:分布式計算的框架27115.2 Hadoop流27315.2.1 分布式計算均值和方差的mapper27315.2.2 分布式計算均值和方差的recer27415.3 在Amazon網路服務上運行Hadoop程序27515.3.1 AWS上的可用服務27615.3.2 開啟Amazon網路服務之旅27615.3.3 在EMR上運行Hadoop作業27815.4 MapRece上的機器學習28215.5 在Python中使用mrjob來自動化MapRece28315.5.1 mrjob與EMR的無縫集成28315.5.2 mrjob的一個MapRece腳本剖析28415.6 示例:分布式SVM的Pegasos演算法28615.6.1 Pegasos演算法28715.6.2 訓練演算法:用mrjob實現MapRece版本的SVM28815.7 你真的需要MapRece嗎?29215.8 本章小結292附錄A Python入門294附錄B 線性代數303附錄C 概率論復習309附錄D 資源312索引313版權聲明316
C. 圖像矩陣用奇異值分解的方法壓縮圖像
利用奇異值分解可以壓縮一個矩陣,但是對於一般的圖像來說每個通道都是一個矩陣,所以不能直接用SVD。
對於A=UDV',如果要重排D的話直接交換U,V中相應的列就行了,相當於A=UP*P'DP*P'V'。一般來講如果調用數學庫中的函數的話D肯定是已經排好的。
補充:
給你舉個例子,如果你要交換D(i,i)和D(j,j),那麼同時把U的第i列和第j列交換一下,把V的第i列和第j列交換一下。
主流的數學庫當中SVD都是LAPACK的實現,次序已經排好了。
D. svd,vcd,dvd,有什麼區別
1、 從名稱上看VCD、CVD、SVCD、DVD有何不同?
答:VCD是VIDEO COMPACT DISK的縮寫,意即視頻光碟;CVD是英文CHINA VIDEO DISK的縮寫,意即中國人自己的數字光碟;SVCD是英文SUPER VIDEO COMPACT DISK的縮寫,簡稱SVCD,意思是超級VCD;DVD是DIGITAL VIDEO DISK的縮寫,意即數碼視頻光碟。因此VCD、CVD、SVCD、DVD整機對應的中文名稱應該都是數字視盤機或數碼光碟機。
2、 四者性能上有什麼主要差別?
答:首先,四者執行的標准不同。VCD採用的是MPEG-1解碼技術標准,清晰度在250線左右,僅相當於普通錄像機的水平;CVD採用目前最先進的數字影音壓縮技術標准MPEG-2,如使用2/3D1格式,可使畫面的清晰度達到350線,這一清晰度已經是我國目前家庭用小屏幕電視機的清晰度的極限;SVCD與CVD採用的標准相同,清晰度也達到了350線,但一些相關的技術不同;DVD採用的是MPEG-2的技術標准,清晰度已達到500線。其次,從音頻效果看,DVD可提供2個立體聲聲道和1個5+1杜比AC-3環繞立體聲聲道,可提供高質量的環繞立體聲;VCD是1路立體聲輸出,唱卡拉OK時兩個聲道可分別存儲原唱和純伴音兩路信號。CVD的音頻信號採用獨立4聲道錄制,其聲音可以有4個獨立聲道或2路立體聲。SVCD也可以提供2路立體聲和4路單聲道。除此之外DVD、SVCD、CVD還增加了多種語言的字幕等功能。CVD與SVCD從性能上看差別不大,只是CVD側重於娛樂功能,而SVCD側重於教育功能。
3、 用CVD、SVCD機能否播放VCD碟片?效果如何?
答:用CVD、SVCD機完全可以播放VCD碟片,但看VCD碟片時其清晰度僅與用VCD機時相同,因此確實是一種浪費。另一方面,CVD、SVCD機對VCD碟片的糾錯能力如何還是一個未知數。
4、 用DVD機能否播放VCD、CVD、SVCD碟片?
答:用DVD機也能播放VCD碟片,但效果與一般VCD無異。DVD不能播放CVD、SVCD碟片。
5、 VCD、CVD、SVCD、DVD四者價格有何差別?
答:目前市場上的VCD機價格在700-1400元左右;新上市的CVD、SVCD機的價格一般在1400-1800元之間;DVD由於硬體的和軟體都要支付高昂的版權費等因素,價格在2300-5000元不等。
6、 四者的碟片性能、價格、市場發行數量對比如何?
答:四者均採用直徑為12cm的光碟,但容量不一樣。DVD碟片的存儲容量最大達120分鍾以上;CVD的容量按不同的格式可在45-74分鍾之間;SVCD的容量最小,為45分鍾;VCD介於三者之間,為74分鍾。比如存儲同一部120分鍾的故事片,需用一張DVD碟片,兩張VCD碟片,3-4張CVD和SVCD碟片。
目前市場上的VCD碟片最多,其品種可達數萬種之巨,價格在10元到50元不等。截止目前,世界各國共推出了5000餘種DVD碟片,不斷增加,價格在80-230元之間。CVD和SVCD的碟片目前在市場上還不多見,估計價格在30元左右。
7、 四者對配套設備各有什麼要求?
答:目前市場上的中小屏幕彩電清晰度在350線左右,與VCD、CVD、SVCD匹配均可達到相應的效果。但如果購買DVD機則必須使用配備有S-VIDEO輸入的25"以上的大屏幕彩電;如果想聽到完美的音響效果,還要配備杜比AC-3音響系統和高保真音箱,但這套音響設備價格昂貴,普通消費者難以承受。現在有一些DVD機配有模擬杜比數字環繞立體聲系統,只用兩只音箱即可達到滿意的音響效果,性能價格比極高,在購買時要注意分別。
8、 VCD、CVD、SVCD、DVD選哪樣好?
答:據專家預測,由於VCD整機價格最低,碟片內容豐富、價格便宜,雖然清晰度、音效都不如VCD、SVCD和DVD,但一般消費者可以接受。CVD和SVCD整機價格適中,性能優於VCD,但不足的是碟片還未大量上市。由於CVD和SVCD兩種格式互不兼容,而且CVD為企業標准而SVCD為行業標准,具體前景還不明郎,消費者在選購時要注意,以免造成日後有機無碟可放的尷尬情景。DVD無論在價格、性能、配置要求均較高,且碟片量少價高,對住房擁擠或收不高的家庭來說是奢侈;如果您想追求最高影音效果,那麼DVD是您唯一的選擇。
在以後的一段時間里,市場上將是VCD、CVD(或SVCD)、DVD三者共存的局面。業內人士提醒,消費者在選購時除了考慮自身的需要、喜好、經濟條件等實際因此外,還應考慮以下幾個方面的情況:
(1) 整機的價格。
(2) 碟片的價格、數量、內容是否豐富及普及程度。
(3) 圖像清晰度。
(4) 配套設備是否能達到要求
CD是英文ComPactdisc—Digital AUD10的縮寫,本來縮寫為CD—DA,後來又簡稱CD,其專業術語原為「數字化精密型唱片及放唱系統」,可是在目前日常生活中,CD卻已成為激光視、聽、唱系統、音響、音像製品的代名詞。例如「激光唱片」、「激光唱盤」、「鐳射唱碟」、「CD唱片」等:放唱系統則又稱為「激光唱機」、「CD唱機」等。
LD是Laser Disc(激光碟片)的縮寫,由於它主要用於記錄影音資料,所以又叫」激光視盤」,有時還根據讀音直接稱之為」鐳射影碟」。LD的直徑一般為20cm 或30cm,其圖像清晰、音質優良,通常所說的」家庭影院」,往往使用LD播放機作為播放設備,當然播放的碟片也就是LD了。
通常把激光視盤(LD)和激光唱片(CD)統稱為光碟。它們之間的主要區別是:激光視盤的圖像部分採用模擬方式錄制,其聲音部分採用模擬或模擬和數字混合方式錄制;而CD類的聲音和圖像則全部採用數字方式錄制。從作用上看,CD以記錄和重放聲音為主,而LD則以記錄和重放圖像為主。
VCD是 Video Compact Disc的縮寫,譯為「視頻壓縮碟片」,它和普通CD一樣大小,結構上也沒有什麼區別,採用MPEG1壓縮方式在直徑12cm的光碟上存儲74分鍾的活動圖像和聲音信號,所以俗稱「影碟」,又因為它比激光影碟機上使用的LD 影碟小,因此又稱"小影碟」。它的影音播放質量比錄像帶好,但比大影碟稍差。 VCD光碟既可以在VCD機上直接播放,也可以在配置了光碟機的電腦中播放。
VCD規格的基礎源自飛利浦和 WC共同制定規格的卡拉 OK CD。這是按數字活動畫面壓縮方式的國際規格中心的MPEG1擬定的,稱為第一版(Version1.0)。鑒於這個規格是針對卡拉OK用途而開發,並不適用於重放電影那樣的連續活動圖像,圖像部分主要規格為l.15Mbps。圖像壓縮率1/140,聲音約為1/6。為使卡拉OK CD 能發展成VCD,就需加入視頻索引新功能,這就是第一代VCD,規格是1.l版(Version1.1),可在連續信號的任意位置上設定存取點。
索尼和松下對此加以發展,推出更高的VCD第H版(Ver2.0)規格,增加了PBC (Play Back Control,重入控制),即互動式功能和高精度靜止圖像兩種功能。可以通過畫面上顯示的菜單實現人機對話,從菜單中可隨意調出靜止畫面或動畫畫面,還能快速調出和檢索,使更加便於操作,高清晰靜止畫面的解析度為活動畫面的4倍(704X480像素)。
為了提高圖像的清晰度,在VCD基礎上又出現了CVD、SVCD出現了,但從根本上來說沒有實質的突破,都可以兼容 VCD視盤。1997年9月,全國錄制標准化委員會召開新一代VCD標准研討會,正式提出了S-VCD方案。S-VCD即 Super-VCD,稱為超級 VCD。 SVCD增加 VCD的交互功能,使其能更方便地用於教育、培訓以及與網路相聯。而CVD是5月份由幾家企業推出的新型產品,為區別VCD而起的名字,它代表China-VCD,即中國的VCD。CVD提供350線左右的高清晰度畫面和雙路立體聲威4 個獨立聲道的各種專業音響效果,並具有 4種語言以及彩色可滾動字幕,全面兼容 CD、VCD1.1、VCD2.0等碟片。
DVD(Digital Video Disc數字影碟光碟)是由美國的八大電影公司(如哥倫比亞電影公司等)所組成的 HDVA Groap(Hollywood Digital Video Advisory Group)在一起討論一種新的Video Disc之後所產生的。經過多家廠商研發及規格整合後,在 1995年底將 DVD正式定名為「數字多功能光碟」(Digital Versatile Disc)。DVD碟片是由2個厚度為0.6mm的基質層粘貼而成的,並採用了多面多層的技術,即每一面光碟可以儲存雙層數據,一張dVd光碟最多就可以有四層的儲存空間,加上利用聚焦更集中的紅色激光技術,提高了每單位面積的儲存密度,大大的擴大了儲存空間。DVD集計算機技術、光學存儲技術和影視技術等為一體,滿足了人們對大存儲容量、高性能的存儲媒體的需求。
目前DVD的規格主要分為下列五種:
DVD-ROM:只讀型數字多功能光碟
DVD-Video:數字影音光碟
DVD-Audio。:數字音響光碟
DVD-R:可讀寫數字多功能光碟(只能寫一次)
DVD-RAM:可重覆讀寫數字多功能光碟
限於目前在技術開發及價格等多方面的原因,DVD數據盤、游戲盤在市面上還不普及,市面上主要以DVD影音光碟為主。
E. 基於SVD方法壓縮圖像的源代碼
012
F. 基於奇異值分解(SVD)的方法壓縮圖像MATLAB實現
對圖像壓縮不是很了解。奇異值分解在matlab中一般用SVD(X)語句
G. 請用MATLAB結下面的問題,3q
建立命令文件ya_suo_tu_pian.M,並在編程窗口中輸入下列命令:
A=imread('tupian1','jpg');
A=im2double(A);
k=input('請輸入秩k:');
R=A(:,:,1);G=A(:,:,2);B=A(:,:,3);
[U1,D1,V1]=svd(R);[U2,D2,V2]=svd(G);[U3,D3,V3]=svd(B);
V11=V1';V22=V2';V33=V3';
U11=U1(:,[1:k]);U22=U2(:,[1:k]);U33=U3(:,[1:k]);
d1=D1([1:k],[1:k]);d2=D2([1:k],[1:k]);d3=D3([1:k],[1:k]);
V111=V11([1:k],:);V222=V22([1:k],:);V333=V33([1:k],:);
R=U11*d1*V111;G=U22*d2*V222;B=U33*d3*V333;
A(:,:,1)=R;A(:,:,2)=G;A(:,:,3)=B;
imwrite(A,'tupian3','jpg');
A=imread('tupian2','jpg');
A=im2double(A);
R=A(:,:,1);G=A(:,:,2);B=A(:,:,3);
[U1,D1,V1]=svd(R);[U2,D2,V2]=svd(G);[U3,D3,V3]=svd(B);
V11=V1';V22=V2';V33=V3';
U11=U1(:,[1:k]);U22=U2(:,[1:k]);U33=U3(:,[1:k]);
d1=D1([1:k],[1:k]);d2=D2([1:k],[1:k]);d3=D3([1:k],[1:k]);
V111=V11([1:k],:);V222=V22([1:k],:);V333=V33([1:k],:);
R=U11*d1*V111;G=U22*d2*V222;B=U33*d3*V333;
A(:,:,1)=R;A(:,:,2)=G;A(:,:,3)=B;
imwrite(A,'tupian4','jpg')
H. 經典的數字信號處理的演算法主要包括哪些內容
經典數字信號處理的內容,包括離散時間信號與離散時間系統的基本概念、Z變換及離散時間系統分析、離散傅里葉變換、傅里葉變換的快速演算法、離散時間系統的相位與結構、數字濾波器設計(IIR、FIR及特殊形式的濾波器)、信號的正交變換(正交變換的定義與性質、K-L變換、DCT及其在圖像壓縮中的應用)、信號處理中若干典型演算法(如抽取與插值、子帶分解、調制與解調、反卷積、SVD、獨立分量分析及同態濾波)、數字信號處理中的有限字長問題及數字信號處理的硬體實現等;下篇是統計數字信號處理的內容,包括平穩隨機信號的基本概念、經典功率譜估計、參數模型功率譜估計、維納濾波器及自適應濾波器等。
I. 高清視頻壓縮的格式介紹
這一個比較古老的編碼形式,由動態圖像專業組織(Moving Pictureures Experts Group即MPEG)於1994年推出的壓縮標准。
由於壓縮比例較低,已經較為少見。一般一部120分鍾長1080p的電影在此種格式下的大小約為30G上下。 MPEG-4多用於HDTVrip上,直接在HDTV上採用MPEG-4視頻壓縮的很少見。HDTVrip的MPEG-4編碼可以理解為:通過把原有的HDTV文件按照比例縮小到一定的尺寸,以達到在減少文件大小、方便傳輸的同時畫面效果不低於DVD效果的目的。可以說這種編碼格式是為了達到一種畫面效果和文件尺寸的平衡。
由於各個商業集團的紛爭,MPEG-4的標准比較混亂,主要基於MPEG-4的常見標准有DivX和XviD。
DivX是一項由DivXNetworks公司發明的,類似於MP3的數字多媒體壓縮技術。由於Divx後來轉為了商業軟體,其發展受到了很大限制,表現相對欠佳,逐漸在競爭中處於了劣勢。
XviD則是一個開放源碼的MPEG-4 多媒體解碼器,它是基於OpenDivX而編寫的。XviD是由一群原OpenDivX義務開發者在OpenDivX於2001年7月停止開發後自行開發的,應用較廣泛。一部720p的90分鍾長的電影大概在4.3G左右,同時畫面有普通1080p的80%~90%。
MPEG-4具有很多優點。它的壓縮率可以超過100倍,而仍保有極佳的音質和畫質;它可利用最少的數據,獲取最佳的圖像質量,滿足低碼率應用的需求;它更適合於互動式AV服務及遠程監控。具體如下:
1.形狀編碼
形狀信息的獲得首先要對圖形進行分析和分割,把各個代表不同內容的目標分割後再用形狀表示。形狀信息通常用二值
Alpha平面來表示。二值Alpha平面可用臨近信息進行算術編碼(CAE);灰度Alpha平面可用運動補償加DCT變換方式類似紋理編碼一樣進行編碼。
其中用於圖像壓縮的變換有離散Forier變換(DFT)、離散小波變換(DWT)、奇異值分解(SVD)、K-L變換、Walsh變換、Hadamard變換、Harr變換、Slant變換、離散餘弦變換(DCT)。其中K-L變換的去相關性最好,而DCT是接近K-L變換效果的最便於實現的變換。和MPEG-1/2一樣,MPEG-4也選擇了DCT。通常,用於數據壓縮的熵編碼方法有霍夫曼(Huffman)編碼、矢量量化、算術編碼、遊程編碼、LZW編碼等。對於紋理編碼,MPEG-4選擇了把遊程編碼、矢量量化和Huffman編碼進行混合編程編碼(VLC)。紋理編碼要經過DCT變換、量化、DC/AC預測、掃描、基於Hufman的VLC編碼。
2.運動估計和補償
MPEG-4中提供了基於塊的運動估計和補償技術來有效地利用各個VOP中視頻內容上的時間冗餘。一般,運動估計和補償可以看作針對任意形狀圖像序列的塊匹配技術的延伸。塊匹配過程對於標准宏塊使用;預測誤差和用於預測的宏塊運動向量一起被編碼;高級運動補償模式支持重疊塊運動補償,可對8×8塊運動向量進行編碼。為了使運動估計得到高編碼效率,預測圖像和被預測圖像越相似越好,所以在運動估計之前要先進行補償。在目標邊界上的MB先用水平填補而後用垂直填補,其餘完全在VOP之外的MB用擴張填補。
3.紋理編碼
紋理指的是I-VOP圖像和P/B-VOP經運動補償後殘留的圖像信息。紋理一般在變換域進行壓縮編碼和熵編碼。准正式編輯已經出版:靜態圖像壓縮編碼標准(JPEG);數字聲像儲存壓縮編碼標准(MPEG-1);通用視頻圖像壓縮編碼標准(MPEG-2)。
隨後,MPEG專家組於1999年2月正式公布了MPEG-4(ISO/IEC14496)V1.0版本。同年底MPEG-4V2.0版本亦告完成,且於2000年年初正式成為國際標准。MPEG-4標准將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通信及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用普遍採用的統一數據格式,並根據不同的應用需求,現場配置解碼器,開放的編碼系統也可隨時加入新的有效的演算法模塊。為支持對視頻內容的訪問,MPEG-4提出了「視頻對象」的概念。
4.伸屈性
MPEG專家組又推出了專門支持多媒體信息且基於內容檢索的編碼方案MPEG-7及多媒體框架標准MPEG-21。另外,由ITU-T和MPEG聯合開發的新標准H.264是最新的視頻編碼演算法。為了降低碼率,獲得盡可能更好圖像質量,H.264標准吸取了MPEG-4的長處,具有更高的壓縮比、更好的信道適應性,必將在數字視頻的通信和存儲領域得到廣泛的應用,其發展潛力不可限量。
視頻的伸屈性,包括空間伸屈性和時間伸屈性。空間伸屈性可以得到不同的空間解析度,時間伸屈性可得到不同的時間解析度。每種伸屈都有多層,在只有高低2層的情況下,底層指的是基本層,而高層指的是增強層。
5.差錯迴避
VLC碼中的一個比特錯誤會引起同步丟失,而運動補償則會引起錯誤傳遞。MPEG-4的差錯迴避有三個方面:重同步、數據恢復和錯誤隱藏。重同步,是指差錯被檢測後,解碼器和碼流之間重新同步的技術。一般來說,這種方法會將錯誤之前的同步點到重建的同步點之間的數據丟棄。不過這些丟棄的數據可以用其他的技術進行恢復和實施錯誤隱藏。數據恢復工具在解碼器和碼流重新建立起同步後用來恢復丟棄的數據。這些工具不是簡單的用容錯碼恢復,而是用一種差錯迴避手段,即用可逆VLC碼字進行VLC編碼。錯誤隱藏,在重同步有效地將錯誤定位後可以很容易處理。為了進一步提高錯誤隱匿的能力,有必要增加錯誤定位能力,特別是數據分割可以用來提高錯誤定位能力。
總之,為了滿足各種應用的需求,MPEG-4標準的使用范圍相當龐大,具有廣泛的適應性和可擴展性。 全名VC-1視訊編解碼器(Video Codec 1),是微軟所開發的視訊編解碼系統。VC-1是最後被認可的高清編碼格式,不過因為有微軟的後台,所以這種編碼格式不能小窺。相對於MPEG2,VC-1的壓縮比更高,但相對於H.264而言,編碼解碼的計算則要稍小一些。目前來看,VC-1可能是一個比較好的平衡,一般一部1080p長120分鍾的電影大概在26G左右。
J. 視頻怎麼壓縮到500m以內
將一個視頻壓縮到500m以內需要使用格式工廠來修改視頻的比特率,操作方法如下:
操作設備:戴爾電腦
操作系統:win10
操作軟體:格式工廠v4.8
1、選中要壓縮的文件,查看內存大小(文件為4G多)。