‘壹’ 关于视频压缩的原理
视频压缩的原理是视频图像数据有很强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。
(1)视频压缩传输技术扩展阅读:
视频是连续的图像序列,由连续的帧构成,一帧即为一幅图像。由于人眼的视觉暂留效应,当帧序列以一定的速率播放时,我们看到的就是动作连续的视频。由于连续的帧之间相似性极高,为便于储存传输,我们需要对原始的视频进行编码压缩,以去除空间、时间维度的冗余。
视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理。采用压缩技术通常数据带宽降到1-10MB/秒,这样就可以将视频信号保存在计算机中并作相应的处理。
‘贰’ 视频压缩技术存在的价值是什么
何为融合 所谓融合实际上有两层含义,第一层含义是在数据传输方面。以前分别基于PSTN电话网上的语音数据和基于有线电视同轴电缆上的视频数据,以及基于IP的信息数据,都被整合在一个网络中进行传输,这个物理媒介就是融合网络。它统一了在不同网络上传输的多种数据。但是融合网络还有一层含义是在应用层面。它把以前各种异构网络上的应用全部整合到一个IP网络上,从而实现在应用上的大统一,这是一种更直观的理解。 统一的TCP/IP协议使各种基于IP的业务都能互通,如数据网络、电话网络、视频网络都可融合在一起。这种融合技术有很多优势,如企业在现有设施基础上,通过融合技术将数据、语音及多媒体信息建立在统一网络平台上,既降低了管理和企业运 营的成本,又提高了企业工作效率。融合技术的迅猛发展又将使网络本身增加很多新的延展特性。 由于IP对物理距离不敏感,因此,融合将有助于解决劳动力紧缺的问题。人们几乎可以在任何时间、任何地点实现工作和生活需求,如可以利用一条线路使移动用户具有局域网接入、Internet接入、PBX分机、语音邮件以及高速拨号等相关特性。 推进网络融合的因素 追求高效的通信技术手段,提高效率,降低成本,一直是企业IT建设的关注点。以前人们试图在ATM和帧中继网络上实现多业务复用系统,把话音、传真、留言放在同一终端设备上。这几年来,新的话音压缩技术、IP网络上的H.323和SIP呼叫信令技术、媒体流传输技术的商业应用突破,都为企业更有效地利用单一通信平台完成商业通信开辟了新的道路。 以前企业通常需要几个独立的网络来组成,如企业的话音通信系统,由企业的内部程控电话交换系统,连接公共电话系统的PSTN组成。任何跨区域/机构的通话业务都需要支付额外费用。同时企业通常还拥有内部数据通信网(Intranet)系统,由数据局域网和租用公共通信专线或采用虚拟专线(VPN)连接各个分支机构和远程移动用户。 实施融合网络则能改变传统企业的业务通信系统,这就需要摒弃那些只能提供部分通信服务的、多个分离的专用系统,转而融合这些分离的企业话音、数据网络和业务,创新和提升资源利用,使之能够在统一的平台上支持话音、数据、兼视频业务,降低成本,开拓企业新应用和服务。 融合网络解决方案还可以消除企业机构和员工之间的通信距离界限,为员工及业务伙伴之间提供更好的协同工作环境。便捷、有效的通信手段可带来更好的客户服务,从而加强公司与客户的关系。此外,一体化和简洁的通信能够提高生产力,让员工能够更有效地完成工作,并且按优先次序处理重要信息。随着流动性及灵活性的提升,员工可以随时随地工作,并能保持甚至提高工作质量。 和所有的新兴技术一样,融合网络技术的真正价值在于如何利用先进的技术系统帮助用户降低成本、提高效率、通过赢得客户的认同增加竞争优势。实现融合网络的核心就是在统一从有线网络到无线网络的平台上,真正将话音、数据、视频应用技术融合成为突破商业通信障碍的利剑,最终服务于客户。 另外,光通信技术的发展为融合网络的发展提供了必要的带宽和传输质量的保障。随着计算机网络带宽的不断提高和IP服务质量的不断改善,在数据网上传输视频信号已逐渐成为可能。目前已经有了很多种视频应用,例如远程监控、视频点播、电视会议、远程教学等等。伴随着网络传输技术的不断发展,一个企业,尤其是能够拥有一个高带宽的企业网络,将可以非常容易地利用这个高带宽的融合网络,传输视频信号以及其他多业务数据信息。 部署融合网络前的关注点 对许多企业而言,如何同时实现数据、语音以及多媒体信息的高质量传输,成为影响企业高效运作的重要因素。 但事实上,企业在实施融合网络前,会考虑很多实际的问题: 首先是融合的质量。服务质量在IP语音解决方案领域一直备受关注。在管理完善、带宽充足、延迟特性良好的IP网络上,也需要保障服务质量,以达到对语音、数据及视频业务的优先排序。由于局域网同广域网及Internet之间的互联,服务质量监控和管理的复杂性也随之增加了。可用性是融合质量的重要体现,能否达到7×24小时的服务非常重要。此外考虑到视频业务对带宽的需求,带宽容量也是网络融合质量的一个前提。 其次是融合网络的安全性。通过交换型局域网或专用IP局域网传输的基于IP的语音业务是相对安全的,但如果在Internet上或配置为共享广播区域的局域网上传输,则存在很大安全隐患。对于没有采用专线的用户来说,这一问题更加突出。语音加密并结合能够减少延迟的辅助处理器是一个可行之路,当然,同时还要采用VPN和防火墙技术。网络的可移动性和灵活性对融合的成本有着直接的影响,因此也是用户关注的焦点。 具体要求具体对待 对许多企业而言,如何实现IP网络下各种信息的融合,才能节约企业运营成本、提高企业工作效率,是一个必须考虑的问题。在考虑建设和管理融合网络的基础搭建前,关键是如何把应用融合在一起。 第一,融合网络需要提高可用性 网络上的应用越来越多,造成网络的流量越来越大,尤其是需要高带宽支持的应用更是消耗了大量带宽。大量应用无序竞争使得关键业务无法保障、服务质量急剧下降。 当然增加带宽是一个方案,这也是目前较通常的做法,但其结果是成本的无休止的增加,以及即使这样也无法从机制上保障业务质量的无奈。随着新应用的出现和现有应用的频繁使用,网络资源必定出现竞争压力。因此需要规范、控制应用占用资源的优先级别。 第二,融合网络需要更高的安全性 为了加强竞争优势,企业的传统应用越来越多的移植到基于网络的系统上,实现深层次的融合网络。正因为如此,企业也面临着前所未有的安全风险。如何简单、及时的实施信息资源的访问控制和授权用户的网络接入成为融合网络管理者亟待解决的问题。 第三,融合网络的设计需要考虑的问题 在设计阶段,凭借一些网络工具和服务商能够向融合网络用户提供总体评估,其中包括有关提高企业融合网络中语音服务质量(QoS)的精确细节。例如,网络工程师通过网络发送模拟VoIP呼叫,并使用网络评估工具在网络上收集有关抖动、延迟和丢包等可能降低语音QoS因素的数据。这些信息同时发送给数据库工具,数据库工具能够分析有关合成语音通信以及呼叫路径中每台路由器和交换机使用情况与性能状况的数据。最终,这些分析将帮助工程师确定融合通信瓶颈等潜在问题,并避免融合网络安装后的性能问题。 网络融合是趋势所在 随着越来越多的语音应用相继被开发出来。IP协议的服务质量也得到了不断的改善,在数据网上打电话已经成为现实。这一现实使得原本非常昂贵的长途电话变得非常便宜。随着技术的发展,电话网络和数据网络逐渐合二为一,即话音信号通过数据网络传输已经成为现实和普及的趋势。电话网络和数据网络的合并将大大降低通讯网络的运营成本,简化网络的管理,对于用户来说,最大的好处就是节省了费用。 融合网络不仅仅带来了成本的节省和网络管理的简化,此外其最大的益处在于IP技术满足了移动和便捷性的需求。移动的便捷性则在于,通过IP网络,可以实现PC和PC、PC和电话、电话和电话的对接。很多企业愿意采用新的技术来提高生产效率,节约成本。全球性企业和经济全球化的趋势,需要企业融入一个全球化的架构,融合网络的架构是全球化的,在有互联网的地方,就可以和合作伙伴进行语音和数据通讯。 基于融合网络的IP电话代表的是一种工作方式、一种沟通的途径,现代化企业的通信应该是基于IP融合网络的通信,其中包括语音、视频、即时短信、传真、呼叫中心、CRM系统等。由于采用了基于IP的语音和数据融合网络,办公效率将会大大提高。
‘叁’ 谁能详细介绍下无线视频传输技术,越详细越好
随着移动通信业务的增加,无线通信已获得非常广泛的应用。无线网络除了提供语音服务之外,还提供多媒体、高速数据和视频图像业务。无线通信环境(无线信道、移动终端等)以及移动多媒体应用业务的特点对视频图像的视频图像编码与传输技术已成为当今信息科学与技术的前沿课题。
1 无线视频传输技术面临的挑战
数字视频信号具有如下特点:
·数据量大
例如,移动可视电话一般采用QCIF分辨率的图像,它有176X144=25344像开绿灯。如果每个像素由24位来表示,一帧图像的数据量依达594kbit。考虑到实时视频图像传输要求的帧频(电视信号每秒25帧),数据传输速率将达到14.5Mbps!
·实时性要求高
人眼对视频信号的基本要求是,延迟小,实时性好。而普通的数据通信对实时性的要求依比较低,因此相对普通数据通信而言,视频通信要求更好的实时性。
无线环境则具有如下特点:
·无线信道资源有限
由于无线信道环境恶劣,有效的带宽资源十分有限。实现大数据量的视频信号的传输,尤其在面向大众的无线可视应用中,无线信道的资源尤其紧张。
·无线网络是一个时变的网络
无线信道的物理特点决定了无线网络是一个时变的网络。
·无线视频的Qos保障
在移动通信中,用户的移动造成无线视频的Qos保障十分复杂。
由此可以看出,视频信号对传输的需要和无线环境的特点存在尖锐的矛盾,因此无线视频传输面临着巨大的挑战。一般来说,无线视频传输系统的研究设计目标如表1所示。
表1 无线视频传输系统的主要性能指标和设计目标
性能指标 设计目标
视频压缩比
视频传输实时性
视频恢复质量
视频传输鲁棒性
支持Qos的视频业务 用尽量少的比特描述视频图像
更短的传输时延,更快的编码速度
获得用户更满意的视频恢复质量
更好适应传输信道的误比特干扰
提供和用户支持费用相当的服务
事实上,表1中许多性能指标是相互制约的。例如,视频图像压缩比的提高会增加编码算法的复杂度,因此会影响算法的实时实现,并且可能降低视频的恢复质量。
2 视频压缩编码技术
视频信息的数据量十分惊人,要在带宽有限的无线网络上传送,必须经过压缩编码。目前国际上存在两大标准化组织——ITU-T和MPEG——专门研究视频编码方法,负责制公平统一的标准,方便各种视频产品间的互通性。这些协议集中了学术界最优秀的成果。
除各种基于国际标准的编码技术外,还有许多新技术的发展十分引人注目。
2.1 基于协议的视频压缩编码技术
国际电信联盟(ITU-T)已经制定的视频编码标准包括H.261(1990年)、H.263(1995年)、H.263+(1998年),2000年11月份将通过H.263++的最终文本。H.26X系列标准是专门用于低比特率视频通信的视频编码标准,具有较高的压缩比,因此特别适合于无线视频传输的需要。它们采用的基本技术包括:DCT变换、运动补偿、量化、熵编码等。H.263+和H.263++中更增加考虑了较为恶劣的无线环境,设计了多种增强码流鲁棒性的方法,定义了分线编码的语法规则。
MPEG制定的视频编码标准有MPEG-1(1990年)、MPEG-2(1994年)、MPEG-4(完善中)。其中MPEG-1、MPEG-2基本已经定稿,使用的基本技术和H.26X相同。MPEG-1、MPEG-2的特点在于针对的应用主要是数字存储媒体,码率高,它们并不适于无线视频传输。人们熟知的VCD、DVD是MPEG-1、MPEG-2的典型应用。随后,MPEG组织注意到了低比特率应用潜在的巨大市场,开始和ITU-T进行竞争。在MPEG-4的制定中,不仅考虑了高比特率应用,还特别包含了适于无线传输的低比特率应用。MPEG-4标准的最大特点是基于视频对象的编码方法。
无线通信终端是多种多样的,其所处的网络结构、规模也是互异的。视频码流的精细可分级性(Fine Granularity Scalability)适应了传输环境的多样性。
编码协议并不提供完全齐备的解决方案。一般来说,协议内容主要包括码流的语法结构、技术路线、解码方法等,而并未严格规定其中一些关键算法,如运动估计算法、码率控制算法等。运动估计算法在第3部分有较为详细的介绍。码率控制方案在第4部分有较为详细的介绍。
2.2 其他视频压缩编码技术
除上述基于协议的视频标准之外,还有一些优秀的算法由于商业的原因,暂时没有被国际标准完全接纳。典型的例子是DCT变换和小波变换之争。虽然利用小波变换可以取得更好的图像恢复质量,但是因为DCT变换使用较早,有很多商业产品的支持,因此小波变换很难在一夜之间取代DCT变换现有的地位。其他编码方法如,分形编码、基于模型的编码方法、感兴趣区优先编码方法等也都取得了一定的成果,具有更强的压缩能力。但是算法实现过于复杂,达到完全实用尚有一段距离。
在基于小波的低比特率图像压缩算法的研究中,根据小波图像系数的空间分布特性,以及小波多分辨率的视频特点,人们引入矢量量化以充分利用小波图像系数的相关性。根据传统的运动补偿难以与小波变换相结合这一情况,人们还提出了将空间二维帧内小波变换与时间轴一维小波变换相结合的三维小波变换方法。
人类的视觉是一种积极的感受行为,不仅与生理因素有关,还取决于心理因素。人们观察与理解图像时常常会不自觉地对某引起区域产生兴趣。整幅图像的视觉质量往往取决于感兴趣区(ROI:Region of Interest)的图像质量。在保障ROI区部分图像质量的前提下,其他部分可以进行更高的压缩。这样在大大压缩数据量的同时,仍有满意的图像恢复质量。这就是感兴趣区优先编码策略。
3 视频编码实时性研究
由于视频数据的特殊性,视频传输系统对实时性要求很高。这里重点介绍基于视频编码协议算法的实时性问题。小波编码等算法虽然有许多优点,但是算法复杂度太高,目前难于达到实时性要求。下面介绍基于协议编码算法中的几个重要环节,它们对提高视频编码系统实时性有重要作用。
3.1 运动估计
预测编码可以有效去除时间域上的冗余信息,运动估计则是预测编码的重要环节。运动估计是要在参考帧中找到一个和当前帧图像块最相似的图像块,即最佳匹配块。估计结果用运动向量来表示。研究运动估计算法就是要研究匹配块搜索算法。
研究分析表示,原始运动估计算法在编码器运行中消耗了编码器70%左右的执行时间。因此,为了提高编码器执行速度必须首先提高运动估计算法的效率。
穷尽搜索法是最原始的运动估计算法,它能得到全局最优结果,但是由于运算量大,不宜在实现应用中使用。快速运动估计算法通过减小搜索空间,加快了搜索过程。虽然快速运动估计算法得到的运动向量没有穷尽搜索法的结果那样精确,但是由于它可以显着减少运算时间,精度也能满足很多应用的需要,因而它们的应用十分广泛。典型的快速搜索算法有:共轭方向搜索法(CDS)、二维对数法(TDL)、三步搜索法(TSS)、交叉搜索法(CSA)等。
3.2 算法结构的并行化
并行化处理的体系结构十分有利于提高系统处理能力,加之视频编码算法有很强的并行处理潜力,因此,人们研究了编码算法的并行运算能力,进一步保障了编码算法的实时实现。
例如,如果有两个并行处理器,依可以同时进行两个图像块的运行估计或者DCT变换,这样依把运动估计和DCT变换环节的运算时间缩短了一倍。
3.3 高速DSP芯片和专用DSP设计
微电子技术的发展,也使近年来DSP芯片有了很大的进步。每秒几十或上百BOPS次的运算速度(1个BOPS为每秒10亿次)DSP芯片已经出现,这为系统实时处理提高了硬件保证。
通用高速DSP芯片在视频编码算法的研究开发中扮演了重要角色。许多DSP生产厂商甚至提供实现某种编码协议的专用芯片。
4 码率控制研究
编码策略是编码器中重要环节。码率控制技术是视频通信应用中的关键技术之一,它负责编码器各个环节与传输信道和解码器之间的协调,在编码器中具有重要地位。因为码率控制策略需要由具体应用场合决定,所以象H.263+、MPEG-4等视频编码协议,都没有规定具体码率控制方法。
由于视频码流结构具有分层的特点,因而码率控制方案的研究一般分成了两个层交人,图像层码率控制、宏块层码率控制。图像层码率控制的主要任务是,根据系统对编码器输出码率的期望、系统传输延迟的限制、传送缓冲区的满溢程度等同,在一帧图像编码前,确定该帧图像的输出期望比特数。宏块层码率控制的主要任务是,根据图像层码率控制确定的该帧图像的输出期望比特数,给图像各部分选择合适的量化步长。宏块层码率控制的主要依据是率失真(Rate-Distortion)模型。
TMN8码率控制方案,是迄今为止一套优秀的码率控制方案。它被H.263+的TMN8模型的MPEG-4(Version 1)的VM8模型所采纳。该方案的精化部分在于宏块层码率控制部分,它采用了一种十分有效的率失真模型,是宏块层码率控制的误差很小;在图像层码率控制方面,该方案的前提较为简单,主要考虑了编码时延、缓冲区满溢程度等因素,并且要求编码器的工作帧频恒定。
在很多情况下,视频编码的帧频不可能保持恒定,或者不“应该”恒定。考虑到视频编码器工作点的变化,以及现有率失真模型可能存在的误差,人们将现代控制理论引入到图码率控制中,设计了更稳定的码率控制方案。
由于宏块层码率控制环节直接决定图像各宏块使用的量化步长,因此利用宏块层友率控制方法,可以轻易实现图像感兴趣区优先编码策略。使用感兴趣区优先编码策略时,虽然对整幅图像而言仍属低码率编码范畴,但对于感兴趣区域而言却存在局部高码率编码。现有低码率控制算法,包括TMN8方案,都没有考虑到这一现象。它们将整幅图像所有部分都作为低码率编码对象,并以此建立码率控制模型。因此这些码率控制方案直接与感兴趣区优先编码策略相结合时,会导致不应有的码率控制误差。为此,人们又提出了一套用不动声色低码率应用的码率控制框架,它适应了感兴趣区优先编码策略的需要。
5 鲁棒性研究
无线信道干扰因素多,误码率高,因此无线视频的鲁棒传输研究对于无线视频传输的实用化十分重要。
5.1 鲁棒的压缩编码
视频压缩编码的最后一个环节是熵编码。熵编码的特点决定了视频码流对误比特高度敏感。于是,人们设计了多种技术用于在视频编码环节进行差错复原,提高码流鲁棒性。MPEG-4中定义的主要差错控制技术有:重同步(Resynchronization)、数据分割(Data Partition)、可逆变长编码(RVLC)。H.263+中用于差错复原的技术主要包括前向纠错编码(FEC)、条带模式(Slice Mode)、独立分段解码(Independent Segment Decoding)和参考图像选择(Reference Picture Selection)等。H.263++则又增加了数据分割的条带模式,并对参考图像选择模式进行了修改。
此外,在信源解码端,人们又设计了数据恢复(Data Recovery)和差错掩盖(Error Concealment)等技术,以便尽量减少码流中错误比特的负面影响。
5.2 鲁棒的复用环节
多媒体通信中,复用是紧随编码环节的一个环节。以ITU定义的H.324标准为例,该标准由若干协议组成,包括音频编码协议G.723、视频编码协议H.26X、控制协议H.245和复用协议H.223。H.223是一个面向连接的复用器,负责把多媒体终端的多个数据源(音频、视频、数据等)复合为一个码流。Villasenor等已经注意到复用器出现的差错对视频可能产生的影响,但没有特点深入的研究成果。
5.3 鲁棒的信道编码环节
信道编码也称差错控制编码。与信源编码的目的不同,信源编码是尽量压缩数据,用尽量少的比特描述原始视频图像;信道编码是利用附加比特来保障原始比特能正确无误地到达目的地。信道传输中的纠错方法包括:前向误码纠错(FEC)、自动重发(ARQ)和混合纠错(HEC)。
Shannon从理论上给出了信道传输能力的上限。信道编码方法的研究设计目标有二,一是尽量利用信道容量,二是抗干扰性能更强。
Turbo码是近年来纪错编码领域的活跃分支,由法国学者C.Berrou等人在1993年看出的,其模拟性能纪错能力。但是Turbo码的译码算法十分复杂,关于Turbo码译码的实时实现是当前研究热点之一。
5.4 信源信道组合编码
不同的信道编码策略对信元的保护能力也不同。根据信元的重要程度,合理地予以差错控制编码,将有效地提高传输系统的效率。这是不平等的保护策略(Unequal Error Protection)。信元的重要程度,可以有多种划分方法,如按照信元对解码所起作用,或者按照信元对人眼感知所起作用,等等。
还有许多学者研究了信道模型在信源信道组合编码中的应用。三种典型无线信道模型是二进制对称噪声通道(Binary Symmetric Channels)、加性白高斯噪声通道(Additie White Gaussian Channels)、G-E突发噪声通道(Gilbert-Elliott Bursty Channels)。Chang Wen Chen等在研究这些信道模型的基础上,研究了新的率失真模型,该模型不仅描述了量化引入的误差,而且将信道噪声考虑在内。在一定的信道传输速率要求下,利用这样的率失真模型,不仅可以在子信源之间合理分配比特,而且可以更好地平衡信源编码精度与信道编码保护两者对码率的需要。
6 无线视频传输系统的优化与管理
在前面几部分的研究中,主要目标是解决无线视频传输的基础问题:视频数据的压缩问题、编码的实时实现、视频码流的鲁棒传输。事实上,除了上述问题,还有许多与无线视频传输密切相关的领域,它们对无线视频传输的实现、推广有着举足轻重的影响。
6.1 通信协议的研究
中国公众多媒体通信网是一个基于IP协议的通信网,它的通信协议是基于TCP/IP的。当然,IP协议和TCP协议仅是核心协议。为保证实时视频通信业务能很好地运行,需要使用实时传送协议(RTP)和实时传送控制协议(RTCP)。为了给实时业务或其它特定业务的传送留有足够宽的通道,还必须使用资源预留协议(RSVP)。上述五个通信协议是IP网的主要通信协议。
Ipv6作Internet Protocol的新版本,将继承和取代传统IP(Ipv4)。从Ipv4到Ipv6的改变将为下一代因特网奠定更坚实的基础,如,Ipv6力求使网络管理变得更加简单,考虑到不同用户对服务质量的不同需要,其中若干技术十分有利于实时多媒体业务的实理。
6.2 接入控制(Admissior Control)
类似有线网络,无线网络要决定是否允许新连接接入;此外无线网络还要决定是否允许切换连接,并要在二者之间谋求最优解决方案。
Naghshineh在1996年提出虚拟连接树的新概念,设计了基于虚拟连接树的高速移动ATM网络体系,并研究了在该体系结构下的接入控制方案。简单说,作者用一个虚拟树来描述位于一定距离内小区的移动用户。一旦移动用户的呼叫被允许,他依可以在虚拟树内的所有小区间自由切换,而无须重新请求。
在高速无线多媒体网络中,Oliveira等则提出了基于带宽预留的接入控制方案,即在建立呼叫小区附近入的小区中,进行带宽预留,以保障服务质量。当用户进入一个新的小区,被预留的带宽将被利用。
6.3 资源预留(Resource Reservation)
对于视频、话音等实时业务,为保证可接受的服务质量,应该保留一定的连接带宽。此外,与新呼叫相比,切换呼叫应有更高的优先权。
6.4 Qos业务模型(Qos Service Model)
无线多媒体Qos支持的基本目标是,在带宽有限情况下,提供和用户支付费用相当的服务质量。建立合适的业务模型是首先要解决的问题。所谓业务模型,就是要根据各种具体应用的特点,将其划分成不同类型。例如,在支持Qos和ATM中定义了几种业务模型:恒定比特率(CBR)业务、实时可变比特率(rt-VBR)业务、非实时可变比特率(nrt-VBR)业务、可用比特率(ABR)业务和不定比特率(UBR)业务。恒定比特率业务对带宽的要求最为严格,其他类型对带宽的要求依次放松。
现有的大理多媒体业务是在基于IP的网络上开展的,而rc设计IP协议的初衷是传输数据的,是一种“尽力而为”的网络,并不支持Qos。为此,其上的实时业务模型被分为两类:有保障业务(Guaranteed Service)和无保障业务(Predictive Service)。
总之,在无线多媒体环境下,建立起合理的业务模型对保障Qos至关重要。在这一领域,人们始终在做出努力。如,较早时候,Oliverira等只用实时业务与非实时业务加以区分;1999年,Talukder等提出三类业务模型;2000年,Lei Huang等不仅考虑带宽和延迟需要,还考虑了移动用户的运动特性,提出多达七类业务模型。
6.5 图像质量评价准则
恰当的图像质量评价方法是无线多媒体通信的基本需要。由于无线环境带宽有限,不可能为所有用户都提供相同质量的服务,所以只能提供和用户支付费用相当的服务质量。因此必须有一套能准确反映用户接受服务的客观质量标准。
除了些特殊场合,纯粹额观评价(如基于均方误差的评价方法)已经被普遍认为不是真正“客观”的图像质量评价,越来越多的人认为,人眼视觉系统(HVS)的特性应该考虑在内。
Westen等人在1995年提出了基于多通道的HVS模型,用来评价图像的感受质量。宋坚信等人最近又提出一种压缩视频感觉质量的计算方法,其核心思想是,利用视觉掩蔽特性, 分析与压缩视频质量有关的视觉特性及视频图像内容特性,提出视觉掩蔽计算结构及用模糊学方法进行视觉阈值提升的计算方法。
总之,面向恶劣无线环境的数字视频传输技术尚未成熟;面向大众应用的无线视频传输技术元未成熟。因此,现在加强在该领域的研究力度,是增强我国科技实力的一次机遇,对于我国在未来通信领域占据一席之地将起重要作用。
‘肆’ 请问视频有实时压缩传输技术吗 就是把4K视频压缩到720P
一般来说,目前常用的解决方案是通过ffmpeg进行一次转推,开启实时模式,从rtmp拉流,加一个scale然后再通过rtmp推出去。
其实思路就是把你说的这个需求切分成3部分,从来源获取视频流,配上充足的算力保证解码和二次编码的速度均大于1倍,然后再把新的流推回去,你想要的只是本地实现,那就本地开3个Docker分别跑这三个服务就好了。
专门做直播的公司有没有私有不开放的技术就不太清楚了。
‘伍’ 常用的视频压缩标准是什么啊
视频压缩标准如下:
1、H.261
H.261标准是为ISDN设计,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。
H.261标准主要采用运动补偿的帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计精度只精确到像素级。支持两种图像扫描格式:QCIF和CIF。
2、H.263
H.263标准是甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。
H.263使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。H.263支持多种分辨率:SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
3、H.264/AVC
视频压缩国际标准主要有由ITU-T制定的H.261、H.262、H.263、H.264和由MPEG制定的MPEG-1、MPEG-2、MPEG-4,其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T与MPEG联合制定。
从简单来说H.264就是一种视频编码技术,与微软的WMV9都属于同一种技术也就是压缩动态图像数据的“编解码器”程序。
一般来说,如果动态图像数据未经压缩就使用的话,数据量非常大,容易造成通信线路故障及数据存储容量紧张。
因此,在发送动态图像时、或者把影像内容保存在DVD上时、以及使用存储介质容量较小的数码相机或相机手机拍摄映像时,就必须使用编解码器。虽然编解码器有许多种类,但DVD-Video与微波数字电视等使用的主要是MPEG2,数码相机等摄像时主要使用MPEG4。
既然作为压缩视频编码技术,H.264最大的作用对视频的压缩了。我们熟悉的MPEG2也就是最常用的DVD视频编码技术已经比较落后。
MPEG-4
MPEG-4标准并非是MPEG-2的替代品,它着眼于不同的应用领域。MPEG-4的制定初衷主要针对视频会议、可视电话超低比特率压缩(小于64Kb/s)的需求。在制定过程中,MPEG组织深深感受到人们对媒体信息,特别是对视频信息的需求由播放型转向基于内容的访问、检索和操作。
MPEG-4与前面提到的JPEG、MPEG-1/2有很大的不同,它为多媒体数据压缩编码提供了更为广阔的平台,它定义的是一种格式、一种框架,而不是具体算法,它希望建立一种更自由的通信与开发环境。
于是MPEG-4新的目标就是定义为:支持多种多媒体的应用,特别是多媒体信息基于内容的检索和访问,可根据不同的应用需求,现场配置解码器。编码系统也是开放的,可随时加入新的有效的算法模块。应用范围包括实时视听通信、多媒体通信、远地监测/监视、VOD、家庭购物/娱乐等。
MPEG-4视频压缩算法相对于MPEG-1/2在低比特率压缩上有着显着提高,在CIF(352*288)或者更高清晰度(768*576)情况下的视频压缩,无论从清晰度还是从存储量上都比MPEG1具有更大的优势,也更适合网络传输。另外MPEG-4可以方便地动态调整帧率、比特率,以降低存储量。
MPEG-4由于系统设计过于复杂,使得MPEG-4难以完全实现并且兼容,很难在视频会议、可视电话等领域实现,这一点有点偏离原来地初衷。
‘陆’ 怎样压缩视频文件
视频压缩比例理论上可以达到99%,但是实际上情况,压缩太多会导致视频模糊。视频压缩软件使用都很简单,需要根据自己的要求,调整视频压缩的强度
‘柒’ 音频视频压缩技术概述
数字技术的出现与应用为人类带来了深远的影响,人们如今已生活在一个几乎数字化的世界之中,而数字音频技术则称得上是应用最为广泛的数字技术之一,CD、 VCD等早已走进千家万户,数字化广播正在全球范围内逐步得到开展,正是这些与广大消费者密切相关的产品及应用成为了本文将要介绍的主题:数字音频压缩技术得以产生和发展的动力。
1、音频压缩技术的出现及早期应用
音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。
数字信号的优势是显而易见的,而它也有自身相应的缺点,即存储容量需求的增加及传输时信道容量要求的增加。以CD为例,其采样率为44.1KHz,量化精度为16比特,则1分钟的立体声音频信号需占约10M字节的存储容量,也就是说,一张CD唱盘的容量只有1小时左右。当然,在带宽高得多的数字视频领域这一问题就显得更加突出。是不是所有这些比特都是必需的呢?研究发现,直接采用PCM码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下对声音至少可进行4:1压缩,即只用25%的数字量保留所有的信息,而在视频领域压缩比甚至可以达到几百倍。因而,为利用有限的资源,压缩技术从一出现便受到广泛的重视。
对音频压缩技术的研究和应用由来已久,如A律、u律编码就是简单的准瞬时压扩技术,并在ISDN话音传输中得到应用。对语音信号的研究发展较早,也较为成熟,并已得到广泛应用,如自适应差分PCM(ADPCM)、线性预测编码(LPC)等技术。在广播领域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬时压扩音频复用)等系统中都使用了音频压缩技术。
2、音频压缩算法的主要分类及典型代表
一般来讲,可以将音频压缩技术分为无损(lossless)压缩及有损(lossy)压缩两大类,而按照压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。各种不同的压缩技术,其算法的复杂程度(包括时间复杂度和空间复杂度)、音频质量、算法效率(即压缩比例),以及编解码延时等都有很大的不同。各种压缩技术的应用场合也因之而各不相同。
(1)时域压缩(或称为波形编码)技术是指直接针对音频PCM码流的样值进行处理,通过静音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低,声音质量一般,压缩比小(CD音质> 400kbps),编解码延时最短(相对其它技术)。此类压缩技术一般多用于语音压缩,低码率应用(源信号带宽小)的场合。时域压缩技术主要包括 G.711、ADPCM、LPC、CELP,以及在这些技术上发展起来的块压扩技术如NICAM、子带ADPCM(SB-ADPCM)技术如G.721、 G.722、Apt-X等。
(2)子带压缩技术是以子带编码理论为基础的一种编码方法。子带编码理论最早是由Crochiere等于1976年提出的。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和下面介绍的变换压缩技术都是根据人对声音信号的感知模型(心理声学模型),通过对信号频谱的分析来决定子带样值或频域样值的量化阶数和其它参数选择的,因此又可称为感知型(Perceptual)压缩编码。这两种压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。
由于在子带压缩技术中主要应用了心理声学中的声音掩蔽模型,因而在对信号进行压缩时引入了大量的量化噪声。然而,根据人类的听觉掩蔽曲线,在解码后,这些噪声被有用的声音信号掩蔽掉了,人耳无法察觉;同时由于子带分析的运用,各频带内的噪声将被限制在频带内,不会对其它频带的信号产生影响。因而在编码时各子带的量化阶数不同,采用了动态比特分配技术,这也正是此类技术压缩效率高的主要原因。在一定的码率条件下,此类技术可以达到“完全透明”的声音质量(EBU音质标准)。
子带压缩技术目前广泛应用于数字声音节目的存储与制作和数字化广播中。典型的代表有着名的MPEG-1层Ⅰ、层Ⅱ(MUSICAM),以及用于Philips DCC中的PASC(Precision Adaptive Subband Coding,精确自适应子带编码)等。
(3)变换压缩技术与子带压缩技术的不同之处在于该技术对一段音频数据进行“线性”的变换,对所获得的变换域参数进行量化、传输,而不是把信号分解为几个子频段。通常使用的变换有DFT、DCT(离散余弦变换)、MDCT等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获得显着改善,而相应付出的代价则是计算复杂度的提高。
变换域压缩具有一些不完善之处,如块边界影响、预回响、低码率时声音质量严重下降等。然而随着技术的不断进步,这些缺陷正逐步被消除,同时在许多新的压缩编码技术中也大量采用了传统变换编码的某些技术。
有代表性的变换压缩编码技术有DolbyAC-2、AT&T的ASPEC(Audio Spectral Perceptual Entropy Coding)、PAC(PerceptualAudioCoder)等。
3、音频压缩技术的标准化和MPEG-1
由于数字音频压缩技术具有广阔的应用范围和良好的市场前景,因而一些着名的研究机构和大公司都不遗余力地开发自己的专利技术和产品。这些音频压缩技术的标准化工作就显得十分重要。CCITT(现ITU-T)在语音信号压缩的标准化方面做了大量的工作,制订了如G.711、G.721、G.728等标准,并逐渐受到业界的认同。
在音频压缩标准化方面取得巨大成功的是MPEG-1音频(ISO/IEC11172-3)。在MPEG-1中,对音频压缩规定了三种模式,即层Ⅰ、层Ⅱ(即MUSICAM,又称MP2),层Ⅲ(又称MP3)。由于在制订标准时对许多压缩技术进行了认真的考察,并充分考虑了实际应用条件和算法的可实现性(复杂度),因而三种模式都得到了广泛的应用。VCD中使用的音频压缩方案就是MPEG-1层Ⅰ;而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用;MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。可以说,MPEG-1音频标准的制订方式决定了它的成功,这一思路甚至也影响到后面将要谈到的MPEG-2和MPEG-4音频标准的制订。
最新进展
1、多声道音频信号压缩与DolbyAC-3
随着技术的不断进步和生活水准的不断提高,原有的立体声形式已不能满足受众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。
更准确地说,环绕声应该是一种声音恢复形式,其新技术的含量实际表现在随着这种形式发展起来的一些数字压缩标准上。环绕声技术发展至今已相当成熟,已日渐成为未来声音形式的主流。有鉴于此,1992年CCIR(ITU-R)以建议的形式约定了多声道声音系统的结构及向下兼容变换的标准,即CCIR Recommendation 775。其中主要约定了大家熟知的5.1声道形式及7.1声道形式,而在对环绕声压缩的研究上也产生了许多专利技术,如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。这些技术在不同的场合,尤其是在影剧院、家庭影院系统,及将来的高清晰度电视(HDTV)等系统中得到广泛的应用。
(1)Dolby AC-3技术是由美国杜比实验室主要针对环绕声开发的一种音频压缩技术。在5.1声道的条件下,可将码率压缩至384kbps,压缩比约为10:1。Dolby AC-3最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之一。
Dolby AC-3是一种感知型压缩编码技术。
在Dolby AC-3中,音频输入以音频块为单位,块长度为512个样值,在48KHz采样率时即为10.66毫秒,各声道单独处理;音频输入在经过3Hz高通滤波器去除直流成分后,通过另一高频带通滤波器以检测信号的瞬变情况,并用它来控制TDAC变换的长度,以期在频域分辨率和时域分辨率之间得到最好的折中效果; TDAC变换的长度一般为512点,而数据块之间的重叠长度为256点,即TDAC每5.33毫秒进行一次;在瞬变条件下,TDAC长度被等分为256 点,这样DolbyAC-3的频域分辨率为93.75Hz,时域最小分辨率为2.67毫秒;在图1中的定点/浮点转换类似于MPEG-1中比例因子计算的作用,主要是为了获得宽的动态范围,而在分离后的指数部分经编码后则构成了整个信号大致的频谱,又被称为频谱包络;比特分配主要是通过计算解码后的频谱包络(视为功率谱密度)和掩蔽曲线的相关性来进行的;由于比特分配中采用了前/后向混合自适应比特分配以及公共比特池等技术,因而可使有限的码率在各声道之间、不同的频率分量之间获得合理的分配;在对尾数的量化过程中,可对尾数进行抖晃处理,抖晃所使用的伪随机数发生器可在不同的平台上获得相同的结果;AC -3的帧结构由同步字、CRC、同步信息(SI)、码流信息(BSI)、音频块和附加数据等组成,帧长度与TDAC变换的长度有关,在长度为512点时,帧长为32毫秒,即每秒31.25帧。
通过以上叙述可见,在Dolby AC-3中,使用了许多先进的、行之有效的压缩技术。如前/后向混合自适应比特分配、公共比特池、TDAC滤波、频谱包络编码、及低码率条件下使用的多声道高频耦合等。而其中许多技术对其它的多声道环绕声压缩技术的发展都产生了一定的影响。
可以说,AC-3的出现是杜比公司几十年来在声音降噪及编码技术方面的结晶(从一定的角度来看,编码技术实际上就是降低编码噪声影响的技术),在技术上它具有很强的优势。因而即使作为一项专利技术,DolbyAC-3仍然在影院系统、HDTV、消费类电子产品(如LD、DVD)及直播卫星等方面获得了广泛的应用,得到了众多厂商的支持,成为业界事实上的标准。
(2)MPEG-2BC(后向兼容方式),即ISO/IEC13818- 3,是另一种多声道环绕声音频压缩技术。早在1992年初,该方面的讨论工作便已初步开展,并于94年11月正式获得通过。MPEG-2BC主要是在 MPEG-1和CCIRRec.775的基础上发展起来的。与MPEG-1相比较,MPEG-2BC主要在两方面做了重大改进。一是支持多声道声音形式,二是为某些低码率应用场合,如多语声节目、体育比赛解说等而进行的低采样率扩展。同时,标准规定的码流形式还可与MPEG-1的第1和第2层做到前、后向兼容,并可依据CCIR Rec.775做到与双声道、单声道形式的向下兼容,还能够与Dolby Surround形式兼容。
在MPEG-2BC中,由于考虑到其前、后向兼容性以及环绕声音形式的新特点,在压缩算法中除承袭了MPEG-1的绝大部分技术外,为在低码率条件下进一步提高声音质量,还采用了多种新技术。如动态传输通道切换、动态串音、自适应多声道预测、中央声道部分编码(Phantom Coding of Center)、预编码(Predistortion)等。
然而,MPEG-2BC的发展和应用并不如MPEG-1那样一帆风顺。通过对一些相关论文的比较可以发现,MPEG-2BC的编码框图在标准化过程中发生了重大的变化,上述的许多新技术都是在后期引入的。事实上,正是与 MPEG-1的前、后向兼容性成为MPEG-2BC最大的弱点,使得MPEG-2BC不得不以牺牲码率的代价来换取较好的声音质量。一般情况下,MPEG -2BC需640kbps以上的码率才能基本达到EBU“无法区分”声音质量要求。由于MPEG-2BC标准化的进程过快,其算法自身仍存在一些缺陷。这一切都成为MPEG-2BC在世界范围内得到广泛应用的障碍。
(3)DVD(DigitalVersatileDisk)是新一代的多媒体数据存储和交换的标准。在视频DVD的伴音方式及音频DVD的声音格式选择上,AC-3和MPEG-2BC之间的争夺十分激烈,最后达成的协议如表1 所示。可见,多声道环绕声音频压缩技术标准亟待统一。
‘捌’ 视频压缩技术主要解决了什么问题
摘要 (1)刑法学上界定计算机犯罪的目的:为了掌握这类犯罪的特点和规律,促进刑事立法的完善和刑事司法的贯彻,有效遏制此类犯罪的发生。
‘玖’ 关于视频压缩H.246技术标准
H.264标准是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像专家组)的联合视频组(JVT,Joint Video Team)开发的标准,也称为MPEG-4 AVC,它作为MPEG-4 Part10,是“高级视频编码”。 H.264/MPEG-4的应用范围是非常广阔的,它可以适用于多种网络,其高效的编码性能,H.264/MPEG-4可满足多种应用的需求,目前主要应用在以下领域;基于电缆、卫星、Modem、DST等信道的广播;视频数据在光学或磁性设备上的存储,基于ISDN、以太网、DSL无线及移动网络的公话服务、视频流服务、彩信服务等,除了以上介绍的应用,基于H.264/MPEG-4的平台,还会拥现很多新的应用。 H.264具有很强的抗误码特性,可适应丢包率高、干扰严重的信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。因此采用H.264视频压缩技术的聊天工具能够获得更高分辨率的视频影像,即使采用Modem拨号上网的低速率上网方式也能够实现清晰的视频影像传输。 其关键技术: (1) 帧内预测编码 帧内编码用来缩减图象的空间冗余。为了提高H.264帧内预测编码的效率,在给定帧中充分利用相邻宏块是空间相关性,相邻的宏块通常含有相似的属性。因此,在对一给定宏块编码时,首先可以根据周围的宏块预测(典型的是根据左上角的宏块,因为此宏块已经被编码处理),然后对预测植的差值进行编码,这样,相对于直接对该帧编码而言,可以大大减小编码率。 H.246提供六种模式进行4X4像素宏块预测,包括一种直流预测和物种方向预测,对于图象中含有很少空间信息的平坦区。H.246也支持16X16的帧内编码。 (2) 帧间预测编码 帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿。H.246的运动补偿支持以往的视频编码标准中的大部分关键特性,而且灵活地添加了更多的功能,除了支持P帧、B帧外,H.246还支持一种新的流间传送帧-----SP帧。 ① 不同大小和形状的宏块分割 ② 高精度的亚像素运动补偿 ③ 多帧预测 ④ 去块滤器 (3)整数变换 (4)量化 (5)熵编码 补充: http://www.elecfans.com/soft/162/2008/200806043945.html pdf英文文档 http://bbs.dvbcn.com/h264cn.pdf 中文 补充: http://ke..com/view/56322.htm
求采纳
‘拾’ 数字电视的视频压缩技术
论文题目是:数字电视接收机的视频压缩技术
帮写内容:(1)选题依据及研究意义;
(2) 选题研究现状;
(3)研究内容(包括基本思路、框架、主要研究方式、方法
等)
一共是三点,请大家教一下我这三点该怎么写?!
注明:论文我已经写好了:下面是论文提纲(含论文选题、论文主体框架)
论文选题:数字电视接收机的视频压缩技术
第一章:绪论
一、数字电视的发展及视频压缩的必要性;
二、视频图象数字压缩的客观依据;
三、数字电视与接收机(机顶盒);
四、电视信号模数转换标准;
第二章:数字电视机顶盒技术
一、什么是数字电视机顶盒;
二、数字电视机顶盒的基本原理;
三、数字电视机顶盒的结构;
四、数字电视机顶盒的主要技术;
第三章:视频压缩编码技术
一 空间或时间性编码;
二. 加权;
三. 遍历(Scannng);
四. 熵编码;
五. 空间性编码器;
六. 时间性编码;
七. 运动补偿;
八. 双向编码;
九. I、P 和B 画面;
十. MPEG 压缩器;
十一. 预处理;
十二. 类和级;
十三. 小波;
第四章:视频图象压缩标准
一、H.261标准;
二、JPEG标准;
三、MPEG-1压缩编码标准;
四、MPEG-2压缩编码标准;
五、MPEG-4压缩编码标准;
结束语 ;
参考文献 ;
问题补充:题目是学校帮我选择的! 大家可以帮忙把这三点写一下吗? 我真不知道该怎么写! 或者大家帮我写前两点也好了~ 谢谢帮我忙的所有朋友! 拜托各位了!我开题16号就要交了
看看这个能不能帮您!
一、如何选择问题
我一起萦绕于怀的,是在写博士论文开题报告的一年多时间里,导师薛澜教授反复追问的一个问题:“你的 puzzle 是什么?”多少次我不假思索地回答“我的问题就是,中国的半导体产业为什么发展不起来。”薛老师问题以其特有的储蓄,笑而不答。我在心中既恼火又懊丧:这么简单的道理,这么明显的答案,到底哪儿不对了?!
奥妙就在于提出问题的“层次”。不同于政策研究报告,学术文章聚集理论层面、解决理论问题。理论是由一系列前设和术语构造的逻辑体系。特定领域的理论有其特定的概念、范畴和研究范式。只有在相同的概念、视角和范式下,理论才能够对话;只有通过对话,理论才能够发展。极少有硕博论文是创造新理论的,能这样当然最好,但难度很大。我们多数是在既有理论的基础上加以发展,因此,在提出问题时,要以“内行”看得懂的术语和明确的逻辑来表述。审视我最初提出的问题“中国半导体产业为什么发展不起来”,这仅仅是对现象的探询,而非有待求证的理论命题。我的理论命题是:“中国产业政策过程是精英主导的共识过程吗?”在这个命题中,“政策过程”、“精英政治”、“共识诉求”三个术语勾勒出研究的理论大体范围和视角。
其次,选择问题是一个“剥笋”的过程。理论问题总是深深地隐藏在纷繁复杂的现实背后,而发现理论问题,则需要运用理论思维的能力。理论思维的训练是一个长期积累的过程。不过初学者也不必望而却步,大体上可以分“三步走”:第一步,先划定一个“兴趣范围”,如半导体产业、信息产业、农村医疗、高等教育体制等,广泛浏览相关的媒体报道、政府文献和学术文章,找到其中的“症结”或“热点”。第二步,总结以往的研究者大体从哪些理论视角来分析“症结”或“热点”、运用了哪些理论工具,如公共财政的视角、社会冲突范式等。第三步,考察问题的可研究性,也就是我们自己的研究空间和研究的可行性。例如,西方的理论是否无法解释中国的问题?或者同一个问题能否用不同的理论来解释?或者理论本身的前提假设、逻辑推演是否存在缺陷?通过回答这些问题,我们找到自己研究的立足点。不过还要注意我们研究在规定的一到两年时间内,是否可能完成?资料获取是否可行?等等。
最后,如何陈述问题?陈述问题实质上就是凝练核心观点的过程。观点应当来自对现实问题的思考和总结,而不是为了套理论而“削足适履”。中国的政治、经济和社会发展充满动态的、丰富的景象,如何才能用恰当的术语、准确的逻辑表述出来呢?雄心勃勃的初学者往往提出宏伟的概念或框架,但我的建议是尽可能缩小研究范围、明确研究对象,从而理清对象的内存逻辑,保证能在有限的时间内完成规范的学
术论文。如“中国半导体产业政策研究”就是一个非常含糊的陈述,我们可以从几个方面来收缩话题:( 1 )时间:从 1980 年到 2000 年;( 2 )对象:政府的叛乱者和决策行为,而不是市场、企业、治理结构等;( 3 )视角:政治和政府理论中的精英研究;( 4 )案例: 908 工程、 909 工程、 13 号文件和《电子振兴》,这是发生在 1980 - 2000 年间半导体政策领域的两个重大工程和两个重要文件。通过这样的明确界定,我们将目光集中在“政策过程”、“精英”、“共识”几个显而易见的概念上,问题也就水落石出了。同时,问题清楚了,我们在筛选信息和资料时也就有了明确的标准,在这个“信息冗余”的时代,能够大大提高研究效率。
二、 如何做文献综述
首先需要将“文献综述( Literature Review) ”与“背景描述 (Backupground Description) ”区分开来。我们在选择研究问题的时候,需要了解该问题产生的背景和来龙去脉,如“中国半导体产业的发展历程”、“国外政府发展半导体产业的政策和问题”等等,这些内容属于“背景描述”,关注的是现实层面的问题,严格讲不是“文献综述”,关注的是现实层面问题,严格讲不是“文献综述”。“文献综述”是对学术观点和理论方法的整理。其次,文献综述是评论性的( Review 就是“评论”的意思),因此要带着作者本人批判的眼光 (critical thinking) 来归纳和评论文献,而不仅仅是相关领域学术研究的“堆砌”。评论的主线,要按照问题展开,也就是说,别的学者是如何看待和解决你提出的问题的,他们的方法和理论是否有什么缺陷?要是别的学者已经很完美地解决了你提出的问题,那就没有重复研究的必要了。
清楚了文献综述的意涵,现来说说怎么做文献综述。虽说,尽可能广泛地收集资料是负责任的研究态度,但如果缺乏标准,就极易将人引入文献的泥沼。
技巧一:瞄准主流。主流文献,如该领域的核心期刊、经典着作、专职部门的研究报告、重要化合物的观点和论述等,是做文献综述的“必修课”。而多数大众媒体上的相关报道或言论,虽然多少有点价值,但时间精力所限,可以从简。怎样摸清该领域的主流呢?建议从以下几条途径入手:一是图书馆的中外学术期刊,找到一两篇“经典”的文章后“顺藤摸瓜”,留意它们的参考文献。质量较高的学术文章,通常是不会忽略该领域的主流、经典文献的。二是利用学校图书馆的“中国期刊网”、“外文期刊数据库检索”和外文过刊阅览室,能够查到一些较为早期的经典文献。三是国家图书馆,有些上世纪七八十年代甚至更早出版的社科图书,学校图书馆往往没有收藏,但是国图却是一本不少(国内出版的所有图书都要送缴国家图书馆),不仅如此,国图还收藏了很多研究中国政治和政府的外文书籍,从互联网上可以轻松查询到。
技巧二:随时整理,如对文献进行分类,记录文献信息和藏书地点。做博士论文的时间很长,有的文献看过了当时不一定有用,事后想起来却找不着了,所以有时记录是很有必要的。罗仆人就积累有一份研究中国政策过程的书单,还特别记录了图书分类号码和藏书地点。同时,对于特别重要的文献,不妨做一个读书笔记,摘录其中的重要观点和论述。这样一步一个脚印,到真正开始写论文时就积累了大量“干货”,可以随时享用。
技巧三:要按照问题来组织文献综述。看过一些文献以后,我们有很强烈的愿望要把自己看到的东西都陈述出来,像“竹筒倒豆子”一样,洋洋洒洒,蔚为壮观。仿佛一定要向读者证明自己劳苦功高。我写过十多万字的文献综述,后来发觉真正有意义的不过数千字。文献综述就像是在文献的丛林中开辟道路,这条道路本来就是要指向我们所要解决的问题,当然是直线距离最短、最省事,但是一路上风景颇多,迷恋风景的人便往往绕行于迤逦的丛林中,反面“乱花渐欲迷人眼”,“曲径通幽”不知所终了。因此,在做文献综述时,头脑时刻要清醒:我要解决什么问题,人家是怎么解决问题的,说的有没有道理,就行了。
三、如何撰写开题报告
问题清楚了,文献综述也做过了,开题报告便呼之欲出。事实也是如此,一个清晰的问题,往往已经隐含着论文的基本结论;对现有文献的缺点的评论,也基本暗含着改进的方向。开题报告就是要把这些暗含的结论、论证结论的逻辑推理,清楚地展现出来。
写开题报告的目的,是要请老师和专家帮我们判断一下:这个问题有没有研究价值、这个研究方法有没有可能奏效、这个论证逻辑有没有明显缺陷。因此,开题报告的主要内容,就要按照“研究目的和意义”、“文献综述和理论空间”、“基本论点和研究方法”、“资料收集方法和工作步骤”这样几个方面展开。其中,“基本论点和研究方法”是重点,许多人往往花费大量笔墨铺陈文献综述,但一谈到自己的研究方法时但寥寥数语、一掠而过。这样的话,评审老师怎么能判断出你的研究前景呢?又怎么能对你的研究方法给予切实的指导和建议呢?
对于不同的选题,研究方法有很大的差异。一个严谨规范的学术研究,必须以严谨规范的方法为支撑。在博士生课程的日常教学中,有些老师致力于传授研究方法;有的则突出讨论方法论的问题。这都有利于我们每一个人提高自己对研究方法的认识、理解、选择与应用,并具体实施于自己的论文工作中。