『壹』 關於視頻壓縮的原理
視頻壓縮的原理是視頻圖像數據有很強的相關性,也就是說有大量的冗餘信息。其中冗餘信息可分為空域冗餘信息和時域冗餘信息。壓縮技術就是將數據中的冗餘信息去掉(去除數據之間的相關性),壓縮技術包含幀內圖像數據壓縮技術、幀間圖像數據壓縮技術和熵編碼壓縮技術。
(1)視頻壓縮傳輸技術擴展閱讀:
視頻是連續的圖像序列,由連續的幀構成,一幀即為一幅圖像。由於人眼的視覺暫留效應,當幀序列以一定的速率播放時,我們看到的就是動作連續的視頻。由於連續的幀之間相似性極高,為便於儲存傳輸,我們需要對原始的視頻進行編碼壓縮,以去除空間、時間維度的冗餘。
視頻壓縮技術是計算機處理視頻的前提。視頻信號數字化後數據帶寬很高,通常在20MB/秒以上,因此計算機很難對之進行保存和處理。採用壓縮技術通常數據帶寬降到1-10MB/秒,這樣就可以將視頻信號保存在計算機中並作相應的處理。
『貳』 視頻壓縮技術存在的價值是什麼
何為融合 所謂融合實際上有兩層含義,第一層含義是在數據傳輸方面。以前分別基於PSTN電話網上的語音數據和基於有線電視同軸電纜上的視頻數據,以及基於IP的信息數據,都被整合在一個網路中進行傳輸,這個物理媒介就是融合網路。它統一了在不同網路上傳輸的多種數據。但是融合網路還有一層含義是在應用層面。它把以前各種異構網路上的應用全部整合到一個IP網路上,從而實現在應用上的大統一,這是一種更直觀的理解。 統一的TCP/IP協議使各種基於IP的業務都能互通,如數據網路、電話網路、視頻網路都可融合在一起。這種融合技術有很多優勢,如企業在現有設施基礎上,通過融合技術將數據、語音及多媒體信息建立在統一網路平台上,既降低了管理和企業運 營的成本,又提高了企業工作效率。融合技術的迅猛發展又將使網路本身增加很多新的延展特性。 由於IP對物理距離不敏感,因此,融合將有助於解決勞動力緊缺的問題。人們幾乎可以在任何時間、任何地點實現工作和生活需求,如可以利用一條線路使移動用戶具有區域網接入、Internet接入、PBX分機、語音郵件以及高速撥號等相關特性。 推進網路融合的因素 追求高效的通信技術手段,提高效率,降低成本,一直是企業IT建設的關注點。以前人們試圖在ATM和幀中繼網路上實現多業務復用系統,把話音、傳真、留言放在同一終端設備上。這幾年來,新的話音壓縮技術、IP網路上的H.323和SIP呼叫信令技術、媒體流傳輸技術的商業應用突破,都為企業更有效地利用單一通信平台完成商業通信開辟了新的道路。 以前企業通常需要幾個獨立的網路來組成,如企業的話音通信系統,由企業的內部程式控制電話交換系統,連接公共電話系統的PSTN組成。任何跨區域/機構的通話業務都需要支付額外費用。同時企業通常還擁有內部數據通信網(Intranet)系統,由數據區域網和租用公共通信專線或採用虛擬專線(VPN)連接各個分支機構和遠程移動用戶。 實施融合網路則能改變傳統企業的業務通信系統,這就需要摒棄那些只能提供部分通信服務的、多個分離的專用系統,轉而融合這些分離的企業話音、數據網路和業務,創新和提升資源利用,使之能夠在統一的平台上支持話音、數據、兼視頻業務,降低成本,開拓企業新應用和服務。 融合網路解決方案還可以消除企業機構和員工之間的通信距離界限,為員工及業務夥伴之間提供更好的協同工作環境。便捷、有效的通信手段可帶來更好的客戶服務,從而加強公司與客戶的關系。此外,一體化和簡潔的通信能夠提高生產力,讓員工能夠更有效地完成工作,並且按優先次序處理重要信息。隨著流動性及靈活性的提升,員工可以隨時隨地工作,並能保持甚至提高工作質量。 和所有的新興技術一樣,融合網路技術的真正價值在於如何利用先進的技術系統幫助用戶降低成本、提高效率、通過贏得客戶的認同增加競爭優勢。實現融合網路的核心就是在統一從有線網路到無線網路的平台上,真正將話音、數據、視頻應用技術融合成為突破商業通信障礙的利劍,最終服務於客戶。 另外,光通信技術的發展為融合網路的發展提供了必要的帶寬和傳輸質量的保障。隨著計算機網路帶寬的不斷提高和IP服務質量的不斷改善,在數據網上傳輸視頻信號已逐漸成為可能。目前已經有了很多種視頻應用,例如遠程監控、視頻點播、電視會議、遠程教學等等。伴隨著網路傳輸技術的不斷發展,一個企業,尤其是能夠擁有一個高帶寬的企業網路,將可以非常容易地利用這個高帶寬的融合網路,傳輸視頻信號以及其他多業務數據信息。 部署融合網路前的關注點 對許多企業而言,如何同時實現數據、語音以及多媒體信息的高質量傳輸,成為影響企業高效運作的重要因素。 但事實上,企業在實施融合網路前,會考慮很多實際的問題: 首先是融合的質量。服務質量在IP語音解決方案領域一直備受關注。在管理完善、帶寬充足、延遲特性良好的IP網路上,也需要保障服務質量,以達到對語音、數據及視頻業務的優先排序。由於區域網同廣域網及Internet之間的互聯,服務質量監控和管理的復雜性也隨之增加了。可用性是融合質量的重要體現,能否達到7×24小時的服務非常重要。此外考慮到視頻業務對帶寬的需求,帶寬容量也是網路融合質量的一個前提。 其次是融合網路的安全性。通過交換型區域網或專用IP區域網傳輸的基於IP的語音業務是相對安全的,但如果在Internet上或配置為共享廣播區域的區域網上傳輸,則存在很大安全隱患。對於沒有採用專線的用戶來說,這一問題更加突出。語音加密並結合能夠減少延遲的輔助處理器是一個可行之路,當然,同時還要採用VPN和防火牆技術。網路的可移動性和靈活性對融合的成本有著直接的影響,因此也是用戶關注的焦點。 具體要求具體對待 對許多企業而言,如何實現IP網路下各種信息的融合,才能節約企業運營成本、提高企業工作效率,是一個必須考慮的問題。在考慮建設和管理融合網路的基礎搭建前,關鍵是如何把應用融合在一起。 第一,融合網路需要提高可用性 網路上的應用越來越多,造成網路的流量越來越大,尤其是需要高帶寬支持的應用更是消耗了大量帶寬。大量應用無序競爭使得關鍵業務無法保障、服務質量急劇下降。 當然增加帶寬是一個方案,這也是目前較通常的做法,但其結果是成本的無休止的增加,以及即使這樣也無法從機制上保障業務質量的無奈。隨著新應用的出現和現有應用的頻繁使用,網路資源必定出現競爭壓力。因此需要規范、控制應用佔用資源的優先順序別。 第二,融合網路需要更高的安全性 為了加強競爭優勢,企業的傳統應用越來越多的移植到基於網路的系統上,實現深層次的融合網路。正因為如此,企業也面臨著前所未有的安全風險。如何簡單、及時的實施信息資源的訪問控制和授權用戶的網路接入成為融合網路管理者亟待解決的問題。 第三,融合網路的設計需要考慮的問題 在設計階段,憑借一些網路工具和服務商能夠向融合網路用戶提供總體評估,其中包括有關提高企業融合網路中語音服務質量(QoS)的精確細節。例如,網路工程師通過網路發送模擬VoIP呼叫,並使用網路評估工具在網路上收集有關抖動、延遲和丟包等可能降低語音QoS因素的數據。這些信息同時發送給資料庫工具,資料庫工具能夠分析有關合成語音通信以及呼叫路徑中每台路由器和交換機使用情況與性能狀況的數據。最終,這些分析將幫助工程師確定融合通信瓶頸等潛在問題,並避免融合網路安裝後的性能問題。 網路融合是趨勢所在 隨著越來越多的語音應用相繼被開發出來。IP協議的服務質量也得到了不斷的改善,在數據網上打電話已經成為現實。這一現實使得原本非常昂貴的長途電話變得非常便宜。隨著技術的發展,電話網路和數據網路逐漸合二為一,即話音信號通過數據網路傳輸已經成為現實和普及的趨勢。電話網路和數據網路的合並將大大降低通訊網路的運營成本,簡化網路的管理,對於用戶來說,最大的好處就是節省了費用。 融合網路不僅僅帶來了成本的節省和網路管理的簡化,此外其最大的益處在於IP技術滿足了移動和便捷性的需求。移動的便捷性則在於,通過IP網路,可以實現PC和PC、PC和電話、電話和電話的對接。很多企業願意採用新的技術來提高生產效率,節約成本。全球性企業和經濟全球化的趨勢,需要企業融入一個全球化的架構,融合網路的架構是全球化的,在有互聯網的地方,就可以和合作夥伴進行語音和數據通訊。 基於融合網路的IP電話代表的是一種工作方式、一種溝通的途徑,現代化企業的通信應該是基於IP融合網路的通信,其中包括語音、視頻、即時簡訊、傳真、呼叫中心、CRM系統等。由於採用了基於IP的語音和數據融合網路,辦公效率將會大大提高。
『叄』 誰能詳細介紹下無線視頻傳輸技術,越詳細越好
隨著移動通信業務的增加,無線通信已獲得非常廣泛的應用。無線網路除了提供語音服務之外,還提供多媒體、高速數據和視頻圖像業務。無線通信環境(無線信道、移動終端等)以及移動多媒體應用業務的特點對視頻圖像的視頻圖像編碼與傳輸技術已成為當今信息科學與技術的前沿課題。
1 無線視頻傳輸技術面臨的挑戰
數字視頻信號具有如下特點:
·數據量大
例如,移動可視電話一般採用QCIF解析度的圖像,它有176X144=25344像開綠燈。如果每個像素由24位來表示,一幀圖像的數據量依達594kbit。考慮到實時視頻圖像傳輸要求的幀頻(電視信號每秒25幀),數據傳輸速率將達到14.5Mbps!
·實時性要求高
人眼對視頻信號的基本要求是,延遲小,實時性好。而普通的數據通信對實時性的要求依比較低,因此相對普通數據通信而言,視頻通信要求更好的實時性。
無線環境則具有如下特點:
·無線信道資源有限
由於無線信道環境惡劣,有效的帶寬資源十分有限。實現大數據量的視頻信號的傳輸,尤其在面向大眾的無線可視應用中,無線信道的資源尤其緊張。
·無線網路是一個時變的網路
無線信道的物理特點決定了無線網路是一個時變的網路。
·無線視頻的Qos保障
在移動通信中,用戶的移動造成無線視頻的Qos保障十分復雜。
由此可以看出,視頻信號對傳輸的需要和無線環境的特點存在尖銳的矛盾,因此無線視頻傳輸面臨著巨大的挑戰。一般來說,無線視頻傳輸系統的研究設計目標如表1所示。
表1 無線視頻傳輸系統的主要性能指標和設計目標
性能指標 設計目標
視頻壓縮比
視頻傳輸實時性
視頻恢復質量
視頻傳輸魯棒性
支持Qos的視頻業務 用盡量少的比特描述視頻圖像
更短的傳輸時延,更快的編碼速度
獲得用戶更滿意的視頻恢復質量
更好適應傳輸信道的誤比特干擾
提供和用戶支持費用相當的服務
事實上,表1中許多性能指標是相互制約的。例如,視頻圖像壓縮比的提高會增加編碼演算法的復雜度,因此會影響演算法的實時實現,並且可能降低視頻的恢復質量。
2 視頻壓縮編碼技術
視頻信息的數據量十分驚人,要在帶寬有限的無線網路上傳送,必須經過壓縮編碼。目前國際上存在兩大標准化組織——ITU-T和MPEG——專門研究視頻編碼方法,負責制公平統一的標准,方便各種視頻產品間的互通性。這些協議集中了學術界最優秀的成果。
除各種基於國際標準的編碼技術外,還有許多新技術的發展十分引人注目。
2.1 基於協議的視頻壓縮編碼技術
國際電信聯盟(ITU-T)已經制定的視頻編碼標准包括H.261(1990年)、H.263(1995年)、H.263+(1998年),2000年11月份將通過H.263++的最終文本。H.26X系列標準是專門用於低比特率視頻通信的視頻編碼標准,具有較高的壓縮比,因此特別適合於無線視頻傳輸的需要。它們採用的基本技術包括:DCT變換、運動補償、量化、熵編碼等。H.263+和H.263++中更增加考慮了較為惡劣的無線環境,設計了多種增強碼流魯棒性的方法,定義了分線編碼的語法規則。
MPEG制定的視頻編碼標准有MPEG-1(1990年)、MPEG-2(1994年)、MPEG-4(完善中)。其中MPEG-1、MPEG-2基本已經定稿,使用的基本技術和H.26X相同。MPEG-1、MPEG-2的特點在於針對的應用主要是數字存儲媒體,碼率高,它們並不適於無線視頻傳輸。人們熟知的VCD、DVD是MPEG-1、MPEG-2的典型應用。隨後,MPEG組織注意到了低比特率應用潛在的巨大市場,開始和ITU-T進行競爭。在MPEG-4的制定中,不僅考慮了高比特率應用,還特別包含了適於無線傳輸的低比特率應用。MPEG-4標準的最大特點是基於視頻對象的編碼方法。
無線通信終端是多種多樣的,其所處的網路結構、規模也是互異的。視頻碼流的精細可分級性(Fine Granularity Scalability)適應了傳輸環境的多樣性。
編碼協議並不提供完全齊備的解決方案。一般來說,協議內容主要包括碼流的語法結構、技術路線、解碼方法等,而並未嚴格規定其中一些關鍵演算法,如運動估計演算法、碼率控制演算法等。運動估計演算法在第3部分有較為詳細的介紹。碼率控制方案在第4部分有較為詳細的介紹。
2.2 其他視頻壓縮編碼技術
除上述基於協議的視頻標准之外,還有一些優秀的演算法由於商業的原因,暫時沒有被國際標准完全接納。典型的例子是DCT變換和小波變換之爭。雖然利用小波變換可以取得更好的圖像恢復質量,但是因為DCT變換使用較早,有很多商業產品的支持,因此小波變換很難在一夜之間取代DCT變換現有的地位。其他編碼方法如,分形編碼、基於模型的編碼方法、感興趣區優先編碼方法等也都取得了一定的成果,具有更強的壓縮能力。但是演算法實現過於復雜,達到完全實用尚有一段距離。
在基於小波的低比特率圖像壓縮演算法的研究中,根據小波圖像系數的空間分布特性,以及小波多解析度的視頻特點,人們引入矢量量化以充分利用小波圖像系數的相關性。根據傳統的運動補償難以與小波變換相結合這一情況,人們還提出了將空間二維幀內小波變換與時間軸一維小波變換相結合的三維小波變換方法。
人類的視覺是一種積極的感受行為,不僅與生理因素有關,還取決於心理因素。人們觀察與理解圖像時常常會不自覺地對某引起區域產生興趣。整幅圖像的視覺質量往往取決於感興趣區(ROI:Region of Interest)的圖像質量。在保障ROI區部分圖像質量的前提下,其他部分可以進行更高的壓縮。這樣在大大壓縮數據量的同時,仍有滿意的圖像恢復質量。這就是感興趣區優先編碼策略。
3 視頻編碼實時性研究
由於視頻數據的特殊性,視頻傳輸系統對實時性要求很高。這里重點介紹基於視頻編碼協議演算法的實時性問題。小波編碼等演算法雖然有許多優點,但是演算法復雜度太高,目前難於達到實時性要求。下面介紹基於協議編碼演算法中的幾個重要環節,它們對提高視頻編碼系統實時性有重要作用。
3.1 運動估計
預測編碼可以有效去除時間域上的冗餘信息,運動估計則是預測編碼的重要環節。運動估計是要在參考幀中找到一個和當前幀圖像塊最相似的圖像塊,即最佳匹配塊。估計結果用運動向量來表示。研究運動估計演算法就是要研究匹配塊搜索演算法。
研究分析表示,原始運動估計演算法在編碼器運行中消耗了編碼器70%左右的執行時間。因此,為了提高編碼器執行速度必須首先提高運動估計演算法的效率。
窮盡搜索法是最原始的運動估計演算法,它能得到全局最優結果,但是由於運算量大,不宜在實現應用中使用。快速運動估計演算法通過減小搜索空間,加快了搜索過程。雖然快速運動估計演算法得到的運動向量沒有窮盡搜索法的結果那樣精確,但是由於它可以顯著減少運算時間,精度也能滿足很多應用的需要,因而它們的應用十分廣泛。典型的快速搜索演算法有:共軛方向搜索法(CDS)、二維對數法(TDL)、三步搜索法(TSS)、交叉搜索法(CSA)等。
3.2 演算法結構的並行化
並行化處理的體系結構十分有利於提高系統處理能力,加之視頻編碼演算法有很強的並行處理潛力,因此,人們研究了編碼演算法的並行運算能力,進一步保障了編碼演算法的實時實現。
例如,如果有兩個並行處理器,依可以同時進行兩個圖像塊的運行估計或者DCT變換,這樣依把運動估計和DCT變換環節的運算時間縮短了一倍。
3.3 高速DSP晶元和專用DSP設計
微電子技術的發展,也使近年來DSP晶元有了很大的進步。每秒幾十或上百BOPS次的運算速度(1個BOPS為每秒10億次)DSP晶元已經出現,這為系統實時處理提高了硬體保證。
通用高速DSP晶元在視頻編碼演算法的研究開發中扮演了重要角色。許多DSP生產廠商甚至提供實現某種編碼協議的專用晶元。
4 碼率控制研究
編碼策略是編碼器中重要環節。碼率控制技術是視頻通信應用中的關鍵技術之一,它負責編碼器各個環節與傳輸信道和解碼器之間的協調,在編碼器中具有重要地位。因為碼率控制策略需要由具體應用場合決定,所以象H.263+、MPEG-4等視頻編碼協議,都沒有規定具體碼率控制方法。
由於視頻碼流結構具有分層的特點,因而碼率控制方案的研究一般分成了兩個層交人,圖像層碼率控制、宏塊層碼率控制。圖像層碼率控制的主要任務是,根據系統對編碼器輸出碼率的期望、系統傳輸延遲的限制、傳送緩沖區的滿溢程度等同,在一幀圖像編碼前,確定該幀圖像的輸出期望比特數。宏塊層碼率控制的主要任務是,根據圖像層碼率控制確定的該幀圖像的輸出期望比特數,給圖像各部分選擇合適的量化步長。宏塊層碼率控制的主要依據是率失真(Rate-Distortion)模型。
TMN8碼率控制方案,是迄今為止一套優秀的碼率控制方案。它被H.263+的TMN8模型的MPEG-4(Version 1)的VM8模型所採納。該方案的精化部分在於宏塊層碼率控制部分,它採用了一種十分有效的率失真模型,是宏塊層碼率控制的誤差很小;在圖像層碼率控制方面,該方案的前提較為簡單,主要考慮了編碼時延、緩沖區滿溢程度等因素,並且要求編碼器的工作幀頻恆定。
在很多情況下,視頻編碼的幀頻不可能保持恆定,或者不「應該」恆定。考慮到視頻編碼器工作點的變化,以及現有率失真模型可能存在的誤差,人們將現代控制理論引入到圖碼率控制中,設計了更穩定的碼率控制方案。
由於宏塊層碼率控制環節直接決定圖像各宏塊使用的量化步長,因此利用宏塊層友率控制方法,可以輕易實現圖像感興趣區優先編碼策略。使用感興趣區優先編碼策略時,雖然對整幅圖像而言仍屬低碼率編碼范疇,但對於感興趣區域而言卻存在局部高碼率編碼。現有低碼率控制演算法,包括TMN8方案,都沒有考慮到這一現象。它們將整幅圖像所有部分都作為低碼率編碼對象,並以此建立碼率控制模型。因此這些碼率控制方案直接與感興趣區優先編碼策略相結合時,會導致不應有的碼率控制誤差。為此,人們又提出了一套用不動聲色低碼率應用的碼率控制框架,它適應了感興趣區優先編碼策略的需要。
5 魯棒性研究
無線信道干擾因素多,誤碼率高,因此無線視頻的魯棒傳輸研究對於無線視頻傳輸的實用化十分重要。
5.1 魯棒的壓縮編碼
視頻壓縮編碼的最後一個環節是熵編碼。熵編碼的特點決定了視頻碼流對誤比特高度敏感。於是,人們設計了多種技術用於在視頻編碼環節進行差錯復原,提高碼流魯棒性。MPEG-4中定義的主要差錯控制技術有:重同步(Resynchronization)、數據分割(Data Partition)、可逆變長編碼(RVLC)。H.263+中用於差錯復原的技術主要包括前向糾錯編碼(FEC)、條帶模式(Slice Mode)、獨立分段解碼(Independent Segment Decoding)和參考圖像選擇(Reference Picture Selection)等。H.263++則又增加了數據分割的條帶模式,並對參考圖像選擇模式進行了修改。
此外,在信源解碼端,人們又設計了數據恢復(Data Recovery)和差錯掩蓋(Error Concealment)等技術,以便盡量減少碼流中錯誤比特的負面影響。
5.2 魯棒的復用環節
多媒體通信中,復用是緊隨編碼環節的一個環節。以ITU定義的H.324標准為例,該標准由若干協議組成,包括音頻編碼協議G.723、視頻編碼協議H.26X、控制協議H.245和復用協議H.223。H.223是一個面向連接的復用器,負責把多媒體終端的多個數據源(音頻、視頻、數據等)復合為一個碼流。Villasenor等已經注意到復用器出現的差錯對視頻可能產生的影響,但沒有特點深入的研究成果。
5.3 魯棒的信道編碼環節
信道編碼也稱差錯控制編碼。與信源編碼的目的不同,信源編碼是盡量壓縮數據,用盡量少的比特描述原始視頻圖像;信道編碼是利用附加比特來保障原始比特能正確無誤地到達目的地。信道傳輸中的糾錯方法包括:前向誤碼糾錯(FEC)、自動重發(ARQ)和混合糾錯(HEC)。
Shannon從理論上給出了信道傳輸能力的上限。信道編碼方法的研究設計目標有二,一是盡量利用信道容量,二是抗干擾性能更強。
Turbo碼是近年來紀錯編碼領域的活躍分支,由法國學者C.Berrou等人在1993年看出的,其模擬性能紀錯能力。但是Turbo碼的解碼演算法十分復雜,關於Turbo碼解碼的實時實現是當前研究熱點之一。
5.4 信源信道組合編碼
不同的信道編碼策略對信元的保護能力也不同。根據信元的重要程度,合理地予以差錯控制編碼,將有效地提高傳輸系統的效率。這是不平等的保護策略(Unequal Error Protection)。信元的重要程度,可以有多種劃分方法,如按照信元對解碼所起作用,或者按照信元對人眼感知所起作用,等等。
還有許多學者研究了信道模型在信源信道組合編碼中的應用。三種典型無線信道模型是二進制對稱雜訊通道(Binary Symmetric Channels)、加性白高斯雜訊通道(Additie White Gaussian Channels)、G-E突發雜訊通道(Gilbert-Elliott Bursty Channels)。Chang Wen Chen等在研究這些信道模型的基礎上,研究了新的率失真模型,該模型不僅描述了量化引入的誤差,而且將信道雜訊考慮在內。在一定的信道傳輸速率要求下,利用這樣的率失真模型,不僅可以在子信源之間合理分配比特,而且可以更好地平衡信源編碼精度與信道編碼保護兩者對碼率的需要。
6 無線視頻傳輸系統的優化與管理
在前面幾部分的研究中,主要目標是解決無線視頻傳輸的基礎問題:視頻數據的壓縮問題、編碼的實時實現、視頻碼流的魯棒傳輸。事實上,除了上述問題,還有許多與無線視頻傳輸密切相關的領域,它們對無線視頻傳輸的實現、推廣有著舉足輕重的影響。
6.1 通信協議的研究
中國公眾多媒體通信網是一個基於IP協議的通信網,它的通信協議是基於TCP/IP的。當然,IP協議和TCP協議僅是核心協議。為保證實時視頻通信業務能很好地運行,需要使用實時傳送協議(RTP)和實時傳送控制協議(RTCP)。為了給實時業務或其它特定業務的傳送留有足夠寬的通道,還必須使用資源預留協議(RSVP)。上述五個通信協議是IP網的主要通信協議。
Ipv6作Internet Protocol的新版本,將繼承和取代傳統IP(Ipv4)。從Ipv4到Ipv6的改變將為下一代網際網路奠定更堅實的基礎,如,Ipv6力求使網路管理變得更加簡單,考慮到不同用戶對服務質量的不同需要,其中若干技術十分有利於實時多媒體業務的實理。
6.2 接入控制(Admissior Control)
類似有線網路,無線網路要決定是否允許新連接接入;此外無線網路還要決定是否允許切換連接,並要在二者之間謀求最優解決方案。
Naghshineh在1996年提出虛擬連接樹的新概念,設計了基於虛擬連接樹的高速移動ATM網路體系,並研究了在該體系結構下的接入控制方案。簡單說,作者用一個虛擬樹來描述位於一定距離內小區的移動用戶。一旦移動用戶的呼叫被允許,他依可以在虛擬樹內的所有小區間自由切換,而無須重新請求。
在高速無線多媒體網路中,Oliveira等則提出了基於帶寬預留的接入控制方案,即在建立呼叫小區附近入的小區中,進行帶寬預留,以保障服務質量。當用戶進入一個新的小區,被預留的帶寬將被利用。
6.3 資源預留(Resource Reservation)
對於視頻、話音等實時業務,為保證可接受的服務質量,應該保留一定的連接帶寬。此外,與新呼叫相比,切換呼叫應有更高的優先權。
6.4 Qos業務模型(Qos Service Model)
無線多媒體Qos支持的基本目標是,在帶寬有限情況下,提供和用戶支付費用相當的服務質量。建立合適的業務模型是首先要解決的問題。所謂業務模型,就是要根據各種具體應用的特點,將其劃分成不同類型。例如,在支持Qos和ATM中定義了幾種業務模型:恆定比特率(CBR)業務、實時可變比特率(rt-VBR)業務、非實時可變比特率(nrt-VBR)業務、可用比特率(ABR)業務和不定比特率(UBR)業務。恆定比特率業務對帶寬的要求最為嚴格,其他類型對帶寬的要求依次放鬆。
現有的大理多媒體業務是在基於IP的網路上開展的,而rc設計IP協議的初衷是傳輸數據的,是一種「盡力而為」的網路,並不支持Qos。為此,其上的實時業務模型被分為兩類:有保障業務(Guaranteed Service)和無保障業務(Predictive Service)。
總之,在無線多媒體環境下,建立起合理的業務模型對保障Qos至關重要。在這一領域,人們始終在做出努力。如,較早時候,Oliverira等只用實時業務與非實時業務加以區分;1999年,Talukder等提出三類業務模型;2000年,Lei Huang等不僅考慮帶寬和延遲需要,還考慮了移動用戶的運動特性,提出多達七類業務模型。
6.5 圖像質量評價准則
恰當的圖像質量評價方法是無線多媒體通信的基本需要。由於無線環境帶寬有限,不可能為所有用戶都提供相同質量的服務,所以只能提供和用戶支付費用相當的服務質量。因此必須有一套能准確反映用戶接受服務的客觀質量標准。
除了些特殊場合,純粹額觀評價(如基於均方誤差的評價方法)已經被普遍認為不是真正「客觀」的圖像質量評價,越來越多的人認為,人眼視覺系統(HVS)的特性應該考慮在內。
Westen等人在1995年提出了基於多通道的HVS模型,用來評價圖像的感受質量。宋堅信等人最近又提出一種壓縮視頻感覺質量的計算方法,其核心思想是,利用視覺掩蔽特性, 分析與壓縮視頻質量有關的視覺特性及視頻圖像內容特性,提出視覺掩蔽計算結構及用模糊學方法進行視覺閾值提升的計算方法。
總之,面向惡劣無線環境的數字視頻傳輸技術尚未成熟;面向大眾應用的無線視頻傳輸技術元未成熟。因此,現在加強在該領域的研究力度,是增強我國科技實力的一次機遇,對於我國在未來通信領域占據一席之地將起重要作用。
『肆』 請問視頻有實時壓縮傳輸技術嗎 就是把4K視頻壓縮到720P
一般來說,目前常用的解決方案是通過ffmpeg進行一次轉推,開啟實時模式,從rtmp拉流,加一個scale然後再通過rtmp推出去。
其實思路就是把你說的這個需求切分成3部分,從來源獲取視頻流,配上充足的算力保證解碼和二次編碼的速度均大於1倍,然後再把新的流推回去,你想要的只是本地實現,那就本地開3個Docker分別跑這三個服務就好了。
專門做直播的公司有沒有私有不開放的技術就不太清楚了。
『伍』 常用的視頻壓縮標準是什麼啊
視頻壓縮標准如下:
1、H.261
H.261標準是為ISDN設計,主要針對實時編碼和解碼設計,壓縮和解壓縮的信號延時不超過150ms,碼率px64kbps(p=1~30)。
H.261標准主要採用運動補償的幀間預測、DCT變換、自適應量化、熵編碼等壓縮技術。只有I幀和P幀,沒有B幀,運動估計精度只精確到像素級。支持兩種圖像掃描格式:QCIF和CIF。
2、H.263
H.263標準是甚低碼率的圖像編碼國際標准,它一方面以H.261為基礎,以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數據和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國際標准中有效、合理的部分,如:半像素精度的運動估計、PB幀預測等,使它性能優於H.261。
H.263使用的位率可小於64Kb/s,且傳輸比特率可不固定(變碼率)。H.263支持多種解析度:SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
3、H.264/AVC
視頻壓縮國際標准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4,其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T與MPEG聯合制定。
從簡單來說H.264就是一種視頻編碼技術,與微軟的WMV9都屬於同一種技術也就是壓縮動態圖像數據的「編解碼器」程序。
一般來說,如果動態圖像數據未經壓縮就使用的話,數據量非常大,容易造成通信線路故障及數據存儲容量緊張。
因此,在發送動態圖像時、或者把影像內容保存在DVD上時、以及使用存儲介質容量較小的數碼相機或相機手機拍攝映像時,就必須使用編解碼器。雖然編解碼器有許多種類,但DVD-Video與微波數字電視等使用的主要是MPEG2,數碼相機等攝像時主要使用MPEG4。
既然作為壓縮視頻編碼技術,H.264最大的作用對視頻的壓縮了。我們熟悉的MPEG2也就是最常用的DVD視頻編碼技術已經比較落後。
MPEG-4
MPEG-4標准並非是MPEG-2的替代品,它著眼於不同的應用領域。MPEG-4的制定初衷主要針對視頻會議、可視電話超低比特率壓縮(小於64Kb/s)的需求。在制定過程中,MPEG組織深深感受到人們對媒體信息,特別是對視頻信息的需求由播放型轉向基於內容的訪問、檢索和操作。
MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同,它為多媒體數據壓縮編碼提供了更為廣闊的平台,它定義的是一種格式、一種框架,而不是具體演算法,它希望建立一種更自由的通信與開發環境。
於是MPEG-4新的目標就是定義為:支持多種多媒體的應用,特別是多媒體信息基於內容的檢索和訪問,可根據不同的應用需求,現場配置解碼器。編碼系統也是開放的,可隨時加入新的有效的演算法模塊。應用范圍包括實時視聽通信、多媒體通信、遠地監測/監視、VOD、家庭購物/娛樂等。
MPEG-4視頻壓縮演算法相對於MPEG-1/2在低比特率壓縮上有著顯著提高,在CIF(352*288)或者更高清晰度(768*576)情況下的視頻壓縮,無論從清晰度還是從存儲量上都比MPEG1具有更大的優勢,也更適合網路傳輸。另外MPEG-4可以方便地動態調整幀率、比特率,以降低存儲量。
MPEG-4由於系統設計過於復雜,使得MPEG-4難以完全實現並且兼容,很難在視頻會議、可視電話等領域實現,這一點有點偏離原來地初衷。
『陸』 怎樣壓縮視頻文件
視頻壓縮比例理論上可以達到99%,但是實際上情況,壓縮太多會導致視頻模糊。視頻壓縮軟體使用都很簡單,需要根據自己的要求,調整視頻壓縮的強度
『柒』 音頻視頻壓縮技術概述
數字技術的出現與應用為人類帶來了深遠的影響,人們如今已生活在一個幾乎數字化的世界之中,而數字音頻技術則稱得上是應用最為廣泛的數字技術之一,CD、 VCD等早已走進千家萬戶,數字化廣播正在全球范圍內逐步得到開展,正是這些與廣大消費者密切相關的產品及應用成為了本文將要介紹的主題:數字音頻壓縮技術得以產生和發展的動力。
1、音頻壓縮技術的出現及早期應用
音頻壓縮技術指的是對原始數字音頻信號流(PCM編碼)運用適當的數字信號處理技術,在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱為壓縮編碼。它必須具有相應的逆變換,稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的雜訊和一定的失真。
數字信號的優勢是顯而易見的,而它也有自身相應的缺點,即存儲容量需求的增加及傳輸時信道容量要求的增加。以CD為例,其采樣率為44.1KHz,量化精度為16比特,則1分鍾的立體聲音頻信號需占約10M位元組的存儲容量,也就是說,一張CD唱盤的容量只有1小時左右。當然,在帶寬高得多的數字視頻領域這一問題就顯得更加突出。是不是所有這些比特都是必需的呢?研究發現,直接採用PCM碼流進行存儲和傳輸存在非常大的冗餘度。事實上,在無損的條件下對聲音至少可進行4:1壓縮,即只用25%的數字量保留所有的信息,而在視頻領域壓縮比甚至可以達到幾百倍。因而,為利用有限的資源,壓縮技術從一出現便受到廣泛的重視。
對音頻壓縮技術的研究和應用由來已久,如A律、u律編碼就是簡單的准瞬時壓擴技術,並在ISDN話音傳輸中得到應用。對語音信號的研究發展較早,也較為成熟,並已得到廣泛應用,如自適應差分PCM(ADPCM)、線性預測編碼(LPC)等技術。在廣播領域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬時壓擴音頻復用)等系統中都使用了音頻壓縮技術。
2、音頻壓縮演算法的主要分類及典型代表
一般來講,可以將音頻壓縮技術分為無損(lossless)壓縮及有損(lossy)壓縮兩大類,而按照壓縮方案的不同,又可將其劃分為時域壓縮、變換壓縮、子帶壓縮,以及多種技術相互融合的混合壓縮等等。各種不同的壓縮技術,其演算法的復雜程度(包括時間復雜度和空間復雜度)、音頻質量、演算法效率(即壓縮比例),以及編解碼延時等都有很大的不同。各種壓縮技術的應用場合也因之而各不相同。
(1)時域壓縮(或稱為波形編碼)技術是指直接針對音頻PCM碼流的樣值進行處理,通過靜音檢測、非線性量化、差分等手段對碼流進行壓縮。此類壓縮技術的共同特點是演算法復雜度低,聲音質量一般,壓縮比小(CD音質> 400kbps),編解碼延時最短(相對其它技術)。此類壓縮技術一般多用於語音壓縮,低碼率應用(源信號帶寬小)的場合。時域壓縮技術主要包括 G.711、ADPCM、LPC、CELP,以及在這些技術上發展起來的塊壓擴技術如NICAM、子帶ADPCM(SB-ADPCM)技術如G.721、 G.722、Apt-X等。
(2)子帶壓縮技術是以子帶編碼理論為基礎的一種編碼方法。子帶編碼理論最早是由Crochiere等於1976年提出的。其基本思想是將信號分解為若乾子頻帶內的分量之和,然後對各子帶分量根據其不同的分布特性採取不同的壓縮策略以降低碼率。通常的子帶壓縮技術和下面介紹的變換壓縮技術都是根據人對聲音信號的感知模型(心理聲學模型),通過對信號頻譜的分析來決定子帶樣值或頻域樣值的量化階數和其它參數選擇的,因此又可稱為感知型(Perceptual)壓縮編碼。這兩種壓縮方式相對時域壓縮技術而言要復雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。一般來講,子帶編碼的復雜度要略低於變換編碼,編碼延時也相對較短。
由於在子帶壓縮技術中主要應用了心理聲學中的聲音掩蔽模型,因而在對信號進行壓縮時引入了大量的量化雜訊。然而,根據人類的聽覺掩蔽曲線,在解碼後,這些雜訊被有用的聲音信號掩蔽掉了,人耳無法察覺;同時由於子帶分析的運用,各頻帶內的雜訊將被限制在頻帶內,不會對其它頻帶的信號產生影響。因而在編碼時各子帶的量化階數不同,採用了動態比特分配技術,這也正是此類技術壓縮效率高的主要原因。在一定的碼率條件下,此類技術可以達到「完全透明」的聲音質量(EBU音質標准)。
子帶壓縮技術目前廣泛應用於數字聲音節目的存儲與製作和數字化廣播中。典型的代表有著名的MPEG-1層Ⅰ、層Ⅱ(MUSICAM),以及用於Philips DCC中的PASC(Precision Adaptive Subband Coding,精確自適應子帶編碼)等。
(3)變換壓縮技術與子帶壓縮技術的不同之處在於該技術對一段音頻數據進行「線性」的變換,對所獲得的變換域參數進行量化、傳輸,而不是把信號分解為幾個子頻段。通常使用的變換有DFT、DCT(離散餘弦變換)、MDCT等。根據信號的短時功率譜對變換域參數進行合理的動態比特分配可以使音頻質量獲得顯著改善,而相應付出的代價則是計算復雜度的提高。
變換域壓縮具有一些不完善之處,如塊邊界影響、預回響、低碼率時聲音質量嚴重下降等。然而隨著技術的不斷進步,這些缺陷正逐步被消除,同時在許多新的壓縮編碼技術中也大量採用了傳統變換編碼的某些技術。
有代表性的變換壓縮編碼技術有DolbyAC-2、AT&T的ASPEC(Audio Spectral Perceptual Entropy Coding)、PAC(PerceptualAudioCoder)等。
3、音頻壓縮技術的標准化和MPEG-1
由於數字音頻壓縮技術具有廣闊的應用范圍和良好的市場前景,因而一些著名的研究機構和大公司都不遺餘力地開發自己的專利技術和產品。這些音頻壓縮技術的標准化工作就顯得十分重要。CCITT(現ITU-T)在語音信號壓縮的標准化方面做了大量的工作,制訂了如G.711、G.721、G.728等標准,並逐漸受到業界的認同。
在音頻壓縮標准化方面取得巨大成功的是MPEG-1音頻(ISO/IEC11172-3)。在MPEG-1中,對音頻壓縮規定了三種模式,即層Ⅰ、層Ⅱ(即MUSICAM,又稱MP2),層Ⅲ(又稱MP3)。由於在制訂標准時對許多壓縮技術進行了認真的考察,並充分考慮了實際應用條件和演算法的可實現性(復雜度),因而三種模式都得到了廣泛的應用。VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ;而MUSICAM由於其適當的復雜程度和優秀的聲音質量,在數字演播室、DAB、DVB等數位元組目的製作、交換、存儲、傳送中得到廣泛應用;MP3是在綜合MUSICAM和ASPEC的優點的基礎上提出的混合壓縮技術,在當時的技術條件下,MP3的復雜度顯得相對較高,編碼不利於實時,但由於MP3在低碼率條件下高水準的聲音質量,使得它成為軟解壓及網路廣播的寵兒。可以說,MPEG-1音頻標準的制訂方式決定了它的成功,這一思路甚至也影響到後面將要談到的MPEG-2和MPEG-4音頻標準的制訂。
最新進展
1、多聲道音頻信號壓縮與DolbyAC-3
隨著技術的不斷進步和生活水準的不斷提高,原有的立體聲形式已不能滿足受眾對聲音節目的欣賞要求,具有更強定位能力和空間效果的三維聲音技術得到蓬勃發展。而在三維聲音技術中最具代表性的就是多聲道環繞聲技術。
更准確地說,環繞聲應該是一種聲音恢復形式,其新技術的含量實際表現在隨著這種形式發展起來的一些數字壓縮標准上。環繞聲技術發展至今已相當成熟,已日漸成為未來聲音形式的主流。有鑒於此,1992年CCIR(ITU-R)以建議的形式約定了多聲道聲音系統的結構及向下兼容變換的標准,即CCIR Recommendation 775。其中主要約定了大家熟知的5.1聲道形式及7.1聲道形式,而在對環繞聲壓縮的研究上也產生了許多專利技術,如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。這些技術在不同的場合,尤其是在影劇院、家庭影院系統,及將來的高清晰度電視(HDTV)等系統中得到廣泛的應用。
(1)Dolby AC-3技術是由美國杜比實驗室主要針對環繞聲開發的一種音頻壓縮技術。在5.1聲道的條件下,可將碼率壓縮至384kbps,壓縮比約為10:1。Dolby AC-3最初是針對影院系統開發的,但目前已成為應用最為廣泛的環繞聲壓縮技術之一。
Dolby AC-3是一種感知型壓縮編碼技術。
在Dolby AC-3中,音頻輸入以音頻塊為單位,塊長度為512個樣值,在48KHz采樣率時即為10.66毫秒,各聲道單獨處理;音頻輸入在經過3Hz高通濾波器去除直流成分後,通過另一高頻帶通濾波器以檢測信號的瞬變情況,並用它來控制TDAC變換的長度,以期在頻域解析度和時域解析度之間得到最好的折中效果; TDAC變換的長度一般為512點,而數據塊之間的重疊長度為256點,即TDAC每5.33毫秒進行一次;在瞬變條件下,TDAC長度被等分為256 點,這樣DolbyAC-3的頻域解析度為93.75Hz,時域最小解析度為2.67毫秒;在圖1中的定點/浮點轉換類似於MPEG-1中比例因子計算的作用,主要是為了獲得寬的動態范圍,而在分離後的指數部分經編碼後則構成了整個信號大致的頻譜,又被稱為頻譜包絡;比特分配主要是通過計算解碼後的頻譜包絡(視為功率譜密度)和掩蔽曲線的相關性來進行的;由於比特分配中採用了前/後向混合自適應比特分配以及公共比特池等技術,因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對尾數的量化過程中,可對尾數進行抖晃處理,抖晃所使用的偽隨機數發生器可在不同的平台上獲得相同的結果;AC -3的幀結構由同步字、CRC、同步信息(SI)、碼流信息(BSI)、音頻塊和附加數據等組成,幀長度與TDAC變換的長度有關,在長度為512點時,幀長為32毫秒,即每秒31.25幀。
通過以上敘述可見,在Dolby AC-3中,使用了許多先進的、行之有效的壓縮技術。如前/後向混合自適應比特分配、公共比特池、TDAC濾波、頻譜包絡編碼、及低碼率條件下使用的多聲道高頻耦合等。而其中許多技術對其它的多聲道環繞聲壓縮技術的發展都產生了一定的影響。
可以說,AC-3的出現是杜比公司幾十年來在聲音降噪及編碼技術方面的結晶(從一定的角度來看,編碼技術實際上就是降低編碼雜訊影響的技術),在技術上它具有很強的優勢。因而即使作為一項專利技術,DolbyAC-3仍然在影院系統、HDTV、消費類電子產品(如LD、DVD)及直播衛星等方面獲得了廣泛的應用,得到了眾多廠商的支持,成為業界事實上的標准。
(2)MPEG-2BC(後向兼容方式),即ISO/IEC13818- 3,是另一種多聲道環繞聲音頻壓縮技術。早在1992年初,該方面的討論工作便已初步開展,並於94年11月正式獲得通過。MPEG-2BC主要是在 MPEG-1和CCIRRec.775的基礎上發展起來的。與MPEG-1相比較,MPEG-2BC主要在兩方面做了重大改進。一是支持多聲道聲音形式,二是為某些低碼率應用場合,如多語聲節目、體育比賽解說等而進行的低采樣率擴展。同時,標准規定的碼流形式還可與MPEG-1的第1和第2層做到前、後向兼容,並可依據CCIR Rec.775做到與雙聲道、單聲道形式的向下兼容,還能夠與Dolby Surround形式兼容。
在MPEG-2BC中,由於考慮到其前、後向兼容性以及環繞聲音形式的新特點,在壓縮演算法中除承襲了MPEG-1的絕大部分技術外,為在低碼率條件下進一步提高聲音質量,還採用了多種新技術。如動態傳輸通道切換、動態串音、自適應多聲道預測、中央聲道部分編碼(Phantom Coding of Center)、預編碼(Predistortion)等。
然而,MPEG-2BC的發展和應用並不如MPEG-1那樣一帆風順。通過對一些相關論文的比較可以發現,MPEG-2BC的編碼框圖在標准化過程中發生了重大的變化,上述的許多新技術都是在後期引入的。事實上,正是與 MPEG-1的前、後向兼容性成為MPEG-2BC最大的弱點,使得MPEG-2BC不得不以犧牲碼率的代價來換取較好的聲音質量。一般情況下,MPEG -2BC需640kbps以上的碼率才能基本達到EBU「無法區分」聲音質量要求。由於MPEG-2BC標准化的進程過快,其演算法自身仍存在一些缺陷。這一切都成為MPEG-2BC在世界范圍內得到廣泛應用的障礙。
(3)DVD(DigitalVersatileDisk)是新一代的多媒體數據存儲和交換的標准。在視頻DVD的伴音方式及音頻DVD的聲音格式選擇上,AC-3和MPEG-2BC之間的爭奪十分激烈,最後達成的協議如表1 所示。可見,多聲道環繞聲音頻壓縮技術標准亟待統一。
『捌』 視頻壓縮技術主要解決了什麼問題
摘要 (1)刑法學上界定計算機犯罪的目的:為了掌握這類犯罪的特點和規律,促進刑事立法的完善和刑事司法的貫徹,有效遏制此類犯罪的發生。
『玖』 關於視頻壓縮H.246技術標准
H.264標準是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像專家組)的聯合視頻組(JVT,Joint Video Team)開發的標准,也稱為MPEG-4 AVC,它作為MPEG-4 Part10,是「高級視頻編碼」。 H.264/MPEG-4的應用范圍是非常廣闊的,它可以適用於多種網路,其高效的編碼性能,H.264/MPEG-4可滿足多種應用的需求,目前主要應用在以下領域;基於電纜、衛星、Modem、DST等信道的廣播;視頻數據在光學或磁性設備上的存儲,基於ISDN、乙太網、DSL無線及移動網路的公話服務、視頻流服務、彩信服務等,除了以上介紹的應用,基於H.264/MPEG-4的平台,還會擁現很多新的應用。 H.264具有很強的抗誤碼特性,可適應丟包率高、干擾嚴重的信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。因此採用H.264視頻壓縮技術的聊天工具能夠獲得更高解析度的視頻影像,即使採用Modem撥號上網的低速率上網方式也能夠實現清晰的視頻影像傳輸。 其關鍵技術: (1) 幀內預測編碼 幀內編碼用來縮減圖象的空間冗餘。為了提高H.264幀內預測編碼的效率,在給定幀中充分利用相鄰宏塊是空間相關性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據周圍的宏塊預測(典型的是根據左上角的宏塊,因為此宏塊已經被編碼處理),然後對預測植的差值進行編碼,這樣,相對於直接對該幀編碼而言,可以大大減小編碼率。 H.246提供六種模式進行4X4像素宏塊預測,包括一種直流預測和物種方向預測,對於圖象中含有很少空間信息的平坦區。H.246也支持16X16的幀內編碼。 (2) 幀間預測編碼 幀間預測編碼利用連續幀中的時間冗餘來進行運動估計和補償。H.246的運動補償支持以往的視頻編碼標准中的大部分關鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.246還支持一種新的流間傳送幀-----SP幀。 ① 不同大小和形狀的宏塊分割 ② 高精度的亞像素運動補償 ③ 多幀預測 ④ 去塊濾器 (3)整數變換 (4)量化 (5)熵編碼 補充: http://www.elecfans.com/soft/162/2008/200806043945.html pdf英文文檔 http://bbs.dvbcn.com/h264cn.pdf 中文 補充: http://ke..com/view/56322.htm
求採納
『拾』 數字電視的視頻壓縮技術
論文題目是:數字電視接收機的視頻壓縮技術
幫寫內容:(1)選題依據及研究意義;
(2) 選題研究現狀;
(3)研究內容(包括基本思路、框架、主要研究方式、方法
等)
一共是三點,請大家教一下我這三點該怎麼寫?!
註明:論文我已經寫好了:下面是論文提綱(含論文選題、論文主體框架)
論文選題:數字電視接收機的視頻壓縮技術
第一章:緒論
一、數字電視的發展及視頻壓縮的必要性;
二、視頻圖象數字壓縮的客觀依據;
三、數字電視與接收機(機頂盒);
四、電視信號模數轉換標准;
第二章:數字電視機頂盒技術
一、什麼是數字電視機頂盒;
二、數字電視機頂盒的基本原理;
三、數字電視機頂盒的結構;
四、數字電視機頂盒的主要技術;
第三章:視頻壓縮編碼技術
一 空間或時間性編碼;
二. 加權;
三. 遍歷(Scannng);
四. 熵編碼;
五. 空間性編碼器;
六. 時間性編碼;
七. 運動補償;
八. 雙向編碼;
九. I、P 和B 畫面;
十. MPEG 壓縮器;
十一. 預處理;
十二. 類和級;
十三. 小波;
第四章:視頻圖象壓縮標准
一、H.261標准;
二、JPEG標准;
三、MPEG-1壓縮編碼標准;
四、MPEG-2壓縮編碼標准;
五、MPEG-4壓縮編碼標准;
結束語 ;
參考文獻 ;
問題補充:題目是學校幫我選擇的! 大家可以幫忙把這三點寫一下嗎? 我真不知道該怎麼寫! 或者大家幫我寫前兩點也好了~ 謝謝幫我忙的所有朋友! 拜託各位了!我開題16號就要交了
看看這個能不能幫您!
一、如何選擇問題
我一起縈繞於懷的,是在寫博士論文開題報告的一年多時間里,導師薛瀾教授反復追問的一個問題:「你的 puzzle 是什麼?」多少次我不假思索地回答「我的問題就是,中國的半導體產業為什麼發展不起來。」薛老師問題以其特有的儲蓄,笑而不答。我在心中既惱火又懊喪:這么簡單的道理,這么明顯的答案,到底哪兒不對了?!
奧妙就在於提出問題的「層次」。不同於政策研究報告,學術文章聚集理論層面、解決理論問題。理論是由一系列前設和術語構造的邏輯體系。特定領域的理論有其特定的概念、范疇和研究範式。只有在相同的概念、視角和範式下,理論才能夠對話;只有通過對話,理論才能夠發展。極少有碩博論文是創造新理論的,能這樣當然最好,但難度很大。我們多數是在既有理論的基礎上加以發展,因此,在提出問題時,要以「內行」看得懂的術語和明確的邏輯來表述。審視我最初提出的問題「中國半導體產業為什麼發展不起來」,這僅僅是對現象的探詢,而非有待求證的理論命題。我的理論命題是:「中國產業政策過程是精英主導的共識過程嗎?」在這個命題中,「政策過程」、「精英政治」、「共識訴求」三個術語勾勒出研究的理論大體范圍和視角。
其次,選擇問題是一個「剝筍」的過程。理論問題總是深深地隱藏在紛繁復雜的現實背後,而發現理論問題,則需要運用理論思維的能力。理論思維的訓練是一個長期積累的過程。不過初學者也不必望而卻步,大體上可以分「三步走」:第一步,先劃定一個「興趣范圍」,如半導體產業、信息產業、農村醫療、高等教育體制等,廣泛瀏覽相關的媒體報道、政府文獻和學術文章,找到其中的「症結」或「熱點」。第二步,總結以往的研究者大體從哪些理論視角來分析「症結」或「熱點」、運用了哪些理論工具,如公共財政的視角、社會沖突範式等。第三步,考察問題的可研究性,也就是我們自己的研究空間和研究的可行性。例如,西方的理論是否無法解釋中國的問題?或者同一個問題能否用不同的理論來解釋?或者理論本身的前提假設、邏輯推演是否存在缺陷?通過回答這些問題,我們找到自己研究的立足點。不過還要注意我們研究在規定的一到兩年時間內,是否可能完成?資料獲取是否可行?等等。
最後,如何陳述問題?陳述問題實質上就是凝練核心觀點的過程。觀點應當來自對現實問題的思考和總結,而不是為了套理論而「削足適履」。中國的政治、經濟和社會發展充滿動態的、豐富的景象,如何才能用恰當的術語、准確的邏輯表述出來呢?雄心勃勃的初學者往往提出宏偉的概念或框架,但我的建議是盡可能縮小研究范圍、明確研究對象,從而理清對象的內存邏輯,保證能在有限的時間內完成規范的學
術論文。如「中國半導體產業政策研究」就是一個非常含糊的陳述,我們可以從幾個方面來收縮話題:( 1 )時間:從 1980 年到 2000 年;( 2 )對象:政府的叛亂者和決策行為,而不是市場、企業、治理結構等;( 3 )視角:政治和政府理論中的精英研究;( 4 )案例: 908 工程、 909 工程、 13 號文件和《電子振興》,這是發生在 1980 - 2000 年間半導體政策領域的兩個重大工程和兩個重要文件。通過這樣的明確界定,我們將目光集中在「政策過程」、「精英」、「共識」幾個顯而易見的概念上,問題也就水落石出了。同時,問題清楚了,我們在篩選信息和資料時也就有了明確的標准,在這個「信息冗餘」的時代,能夠大大提高研究效率。
二、 如何做文獻綜述
首先需要將「文獻綜述( Literature Review) 」與「背景描述 (Backupground Description) 」區分開來。我們在選擇研究問題的時候,需要了解該問題產生的背景和來龍去脈,如「中國半導體產業的發展歷程」、「國外政府發展半導體產業的政策和問題」等等,這些內容屬於「背景描述」,關注的是現實層面的問題,嚴格講不是「文獻綜述」,關注的是現實層面問題,嚴格講不是「文獻綜述」。「文獻綜述」是對學術觀點和理論方法的整理。其次,文獻綜述是評論性的( Review 就是「評論」的意思),因此要帶著作者本人批判的眼光 (critical thinking) 來歸納和評論文獻,而不僅僅是相關領域學術研究的「堆砌」。評論的主線,要按照問題展開,也就是說,別的學者是如何看待和解決你提出的問題的,他們的方法和理論是否有什麼缺陷?要是別的學者已經很完美地解決了你提出的問題,那就沒有重復研究的必要了。
清楚了文獻綜述的意涵,現來說說怎麼做文獻綜述。雖說,盡可能廣泛地收集資料是負責任的研究態度,但如果缺乏標准,就極易將人引入文獻的泥沼。
技巧一:瞄準主流。主流文獻,如該領域的核心期刊、經典著作、專職部門的研究報告、重要化合物的觀點和論述等,是做文獻綜述的「必修課」。而多數大眾媒體上的相關報道或言論,雖然多少有點價值,但時間精力所限,可以從簡。怎樣摸清該領域的主流呢?建議從以下幾條途徑入手:一是圖書館的中外學術期刊,找到一兩篇「經典」的文章後「順藤摸瓜」,留意它們的參考文獻。質量較高的學術文章,通常是不會忽略該領域的主流、經典文獻的。二是利用學校圖書館的「中國期刊網」、「外文期刊資料庫檢索」和外文過刊閱覽室,能夠查到一些較為早期的經典文獻。三是國家圖書館,有些上世紀七八十年代甚至更早出版的社科圖書,學校圖書館往往沒有收藏,但是國圖卻是一本不少(國內出版的所有圖書都要送繳國家圖書館),不僅如此,國圖還收藏了很多研究中國政治和政府的外文書籍,從互聯網上可以輕松查詢到。
技巧二:隨時整理,如對文獻進行分類,記錄文獻信息和藏書地點。做博士論文的時間很長,有的文獻看過了當時不一定有用,事後想起來卻找不著了,所以有時記錄是很有必要的。羅僕人就積累有一份研究中國政策過程的書單,還特別記錄了圖書分類號碼和藏書地點。同時,對於特別重要的文獻,不妨做一個讀書筆記,摘錄其中的重要觀點和論述。這樣一步一個腳印,到真正開始寫論文時就積累了大量「干貨」,可以隨時享用。
技巧三:要按照問題來組織文獻綜述。看過一些文獻以後,我們有很強烈的願望要把自己看到的東西都陳述出來,像「竹筒倒豆子」一樣,洋洋灑灑,蔚為壯觀。彷彿一定要向讀者證明自己勞苦功高。我寫過十多萬字的文獻綜述,後來發覺真正有意義的不過數千字。文獻綜述就像是在文獻的叢林中開辟道路,這條道路本來就是要指向我們所要解決的問題,當然是直線距離最短、最省事,但是一路上風景頗多,迷戀風景的人便往往繞行於迤邐的叢林中,反面「亂花漸欲迷人眼」,「曲徑通幽」不知所終了。因此,在做文獻綜述時,頭腦時刻要清醒:我要解決什麼問題,人家是怎麼解決問題的,說的有沒有道理,就行了。
三、如何撰寫開題報告
問題清楚了,文獻綜述也做過了,開題報告便呼之欲出。事實也是如此,一個清晰的問題,往往已經隱含著論文的基本結論;對現有文獻的缺點的評論,也基本暗含著改進的方向。開題報告就是要把這些暗含的結論、論證結論的邏輯推理,清楚地展現出來。
寫開題報告的目的,是要請老師和專家幫我們判斷一下:這個問題有沒有研究價值、這個研究方法有沒有可能奏效、這個論證邏輯有沒有明顯缺陷。因此,開題報告的主要內容,就要按照「研究目的和意義」、「文獻綜述和理論空間」、「基本論點和研究方法」、「資料收集方法和工作步驟」這樣幾個方面展開。其中,「基本論點和研究方法」是重點,許多人往往花費大量筆墨鋪陳文獻綜述,但一談到自己的研究方法時但寥寥數語、一掠而過。這樣的話,評審老師怎麼能判斷出你的研究前景呢?又怎麼能對你的研究方法給予切實的指導和建議呢?
對於不同的選題,研究方法有很大的差異。一個嚴謹規范的學術研究,必須以嚴謹規范的方法為支撐。在博士生課程的日常教學中,有些老師致力於傳授研究方法;有的則突出討論方法論的問題。這都有利於我們每一個人提高自己對研究方法的認識、理解、選擇與應用,並具體實施於自己的論文工作中。