H.264/AVC是由ITU和ISO两大组织联合组成的JVT共同制定的一项新的视频压缩技术标准,在较低带宽上提供高质量的图像传输是H.264/AVC的应用亮点。在同样的视觉质量前提下,H.264/AVC比H.263和MPEG-4节约了50%的码率。但H.264获得优越性能的代价是计算复杂度的增加,据估计其编码的计算复杂度大约为H.263的3倍,因此很难应用于实时视频处理领域。针对这一现状,业内做了大量的研究工作,力图降低其计算复杂度和提高运行效率。比如在运动估计方面,国内外在这方面的研究已经很成熟。而针对帧内/帧间预测编码的研究却较少。因此研究预测模式的快速算法具有理论意义和应用价值。 本文在详细研究H.264标准视频压缩编码特点基础上,分析了H.264帧内编码, 帧间编码及变换,量化技术的原理及特点,提出了一种基于局部边缘方向信息的快速帧内模式判决算法,通过结合SAD的模式选择方法来减少模式选择数目。它采用了Sobel梯度算子计算当前块的边缘信息,累加当前块中属于同一方向像素点的边缘矢量构造不同模式下的边缘方向直方图,以便确定最可能的预测模式。该算法有效降低了编码器的运算复杂度,在并未显著降低编码性能的情况下提升了编码器效率。仿真表明:Foreman 图像序列编码性能有了提高,其中PSNR平均降低了0.06dB,Bitrate平均降低了19.4%,这大大提高了视频传输的质量。 另外在帧间预测模式选择算法方面进行了改进研究:按顺序对不同类型进行判决,有选择地去比较可能模式,使得在有效减少需判决的模式数量的同时,结合小块模式搜索中途停止准则来确定最优模式。仿真表明:改进算法相对与原来算法能够节省很多的编码时间(平均下降了49.3%),但带来的图像质星的下降(平均下降0.08dB,可以忽略)和码率较少的增加。 同时在整数DCT变换模块中,提出了一种快速蝶形算法,使得对4×4点数据做一次变换,只需通过8×8次加法和2×8次移位运算便可完成,与原来12×8次加法和4×8次移位相比,新算法大大降低了运算复杂度。 最后介绍FPGA的特点及设计流程,并实现了H.264编解码器中变换编码及量化和熵解码模块的硬件。这种基于FPGA所实现的H.264编码视频处理模块设计具备了成本低,周期短,设计方法灵活等优点,具有广阔的市场应用前景。 仿真表明,通过使用本文提出的帧内/帧间速算法方法可使得H.264编码速度获得显著的提高,使H.264 Baseline编码器能在PC平台上实现实时编码。
上传时间: 2013-07-18
上传用户:zukfu
在信息化发展的当前,音视频等多媒体作为信息的载体,在社会生活的各个领域,起着越来越重要的作用。数字视频的海量性成为阻碍其应用的的瓶颈之一。在这种情况下,H.264作为新一代的视频压缩标准,以其高性能的压缩效率,成为备受关注的焦点和研究问题。H.264通过运动估计/运动补偿(MP/MC)消除视频时间冗余,对差值图像进行离散余弦变换(DCT)消除空间冗余,对量化后的系数进行可变长编码(VLC)消除统计冗余,获得了极高的压缩效率。随着嵌入式处理器性能的逐渐提升和3G网络即将商用的推动,H.264以其优秀的压缩性能,无论是无线信道传输方面,还是存储容量有限的嵌入式设备都具有广阔的应用前景。 但H.264在提升压缩性能的同时付出的代价是算法复杂度的成倍增加,实际应用中人们对视频解码的实时性要求严格,已出现的对应算法代码多基于PC通用处理器实现,而嵌入式设备的主频和处理能力仍然相对有限,存储容量相对较小,总线速率相对偏低,因此必须对标准对应算法进行优化移植,才能满足实际应用的需求。 本文在对H.264标准及其新特性进行详细介绍后,重点研究了在解码端如何针对解码耗时较多的模块进行改进,然后将算法移植到ARM平台,并针对平台特点作出相应优化,最后完成解码图象显示,并给出了测试结果。本文主要完成的工作如下: 详细分析了H.264的参考软件JM中解码流程,并利用测试工具分析了各模块耗时,针对耗时较多的模块如插值运算及去块滤波模块,提出了对应的改进算法并在H.264的参考软件JM86上进行了实现,PC测试实验证明了算法改进的优越性和运算优化的可行性。最后针对ARM平台,在对程序结构和对应代码进行优化之后,将其移植到WINCE系统之下,同时给出了WINCE平台解码后图象加速显示方法,并对最终测试结果与性能做出了评价。
上传时间: 2013-06-04
上传用户:shijiang
在通信系统中,人们一直致力于信息传输的有效性和可靠性的研究,信道纠错编码技术一直是人们研究的重点。1993年,Turbo码的提出,以其接近Shannon极限的优异的译码性能在编码界引起了轰动,并成为研究纠错编码的热点课题。经过十几年的研究和发展,目前,Turbo码已经走向了实用化的道路,如何用硬件实现有效的Turbo码编译码器成为了人们研究的重点。 论文以基于FPGA实现Turbo码译码器为研究目标,首先分析了Turbo码的基本编译码原理和3GPP标准的Turbo码编码结构和交织算法。然后重点分析了MAP译码算法,Log-MAP译码算法和:Max-Log-MAP译码算法,并对三种译码算法进行了详细的理论推导和计算复杂度的定量分析比较,对影响Turbo码译码性能的主要因素进行了MATLB仿真分析。 论文在深入分析比较上述三种译码算法的基础之上,选择Max-Log-MAP译码算法进行了Turbo码译码器的FPGA设计实现。主要针对FPGA实现的数据量化、定点数据表示方式、Max-Log-MAP算法子译码器关键运算单元的FPGA设计和基于3GPP标准的Turbo码译码器的内交织的FPGA设计进行了深入研究,完成了固定译码长度的Turbo码译码器的FPGA设计实现,并利用ModelSim和MATLAB分别对译码器进行了功能时序验证和FPGA定点仿真测试。
上传时间: 2013-07-09
上传用户:caixiaoxu26
H.264作为新一代视频编码标准,相比上一代视频编码标准MPEG2,在相同画质下,平均节约64﹪的码流。该标准仅设定了码流的语法结构和解码器结构,实现灵活性极大,其规定了三个档次,每个档次支持一组特定的编码功能,并支持一类特定的应用,因此。H.264的编码器的设计可以根据需求的不同而不同。 H.264虽然具有优异的压缩性能,但是其复杂度却比一般编码器高的多。本文对H.264进行了编码复杂度分析,并统计了整个软件编码中计算量的分布。H.264中采用了率失真优化算法,提高了帧内预测编码的效率。在该算法下进行帧内预测时,为了得到一个宏块的预测模式,需要进行592次率失真代价计算。因此为了降低帧内预测模式选择的计算复杂度,本文改进了帧内预测模式选择算法。实践证明,在PSNR值的损失可以忽略不计的情况下,该算法相比原算法,帧内编码时间平均节约60﹪以上,对编码的实时性有较大帮助。 为了实现实时编码,考虑到FPGA的高效运算速度和使用灵活性,本文还研究了H.264编码器基本档次的FPGA实现。首先研究了H.264编码器硬件实现架构,并对影响编码速度,且具有硬件实现优越性的几个重要部分进行了算法研究和FPGA.实现。本文主要研究了H.264编码器中整数DCT变换、量化、Zig-Zag扫描、CAVLC编码以及反量化、逆整数DCT变换等部分。分别对这些模块进行了综合和时序仿真,并将验证后通过的系统模块下载到Xilinx virtex-Ⅱ Pro的FPGA中,进行了在线测试,验证了该系统对输入的残差数据实时压缩编码的功能。 本文对H.264编码器帧内预测模式选择算法的改进,算法实现简单,对软件编码的实时性有很大帮助。本文对在单片FPGA上实现H.264编码器做出了探索性尝试,这对H.264编码器芯片的设计有着积极的借鉴性。
上传时间: 2013-05-25
上传用户:refent
本文以“机车车辆轮对动态检测装置”为研究背景,以改进提升装置性能为目标,研究在Altera公司的FPGA(Field Programmable Gate Array)芯片Cyclone上实现图像采集控制、图像处理算法、JPEG(Joint Photographic Expert Group)压缩编码标准的基本系统。本文使用硬件描述语言Verilog,以RedLogic的RVDK开发板作为硬件平台,在开发工具OUARTUS2 6.0和MODELSIM SE 6.1B环境中完成软核的设计与仿真验证。 数据采集部分完成的功能是将由模拟摄像机拍摄到的图像信号进行数字化,然后从数据流中提取有效数据,加以适当裁剪,最后将奇偶场图像数据合并成帧,存储到存储器中。数字化及码流产生的功能由SAA7113芯片完成,由FPGA对SAA7113芯片初始化设置、控制,并对数字化后的数据进行操作。 图像处理算法部分考虑到实时性与算法复杂度等因素,从装置的图像处理流程中有选择性地实现了直方图均衡化、中值滤波与边缘检测三种图像处理算法。 压缩编码部分依据JPEG标准基本系统顺序编码模式,在FPGA上实现了DCT(Discrete Cosine Transform)变换、量化、Zig-Zag扫描、直流系数DPCM(Differential Pulse Code Modulation)编码、交流系数RLC(Run Length code)编码、霍夫曼编码等主要步骤,最后用实际的图像数据块对系统进行了验证。
上传时间: 2013-04-24
上传用户:qazwsc
提出通过对分块图像的DCT 系数进行动态范围压缩来改进传统的基于DCT 变换的图像自嵌入水印算法,并结合灰度变换函数与JPEG 标准量化表重新设计了DCT 系数码长分配表,大幅度提升了量化过程保留的图
上传时间: 2013-07-28
上传用户:小鹏
论文研究了基于Bayer格式的CCD原始图像的颜色插值算法,并将设计的改进算法应用到以FPGA为核心的图像采集前端。出于对成本和体积的考虑,一般的数字图像采集系统采用单片CCD或CMOS图像传感器,然后在感光表面覆盖一层颜色滤波阵列(CFA),经过CFA后每个像素点只能获得物理三基色(红、绿、蓝)其中一种分量,形成马赛克图像。为了获得全彩色图像,就要利用周围像素点的值近似地计算出被滤掉的颜色分量,称这个过程为颜色插值。由于当前对图像采集系统的实时性要求越来越高,业内已经开始广泛采用FPGA来进行图像处理,充分发挥硬件并行运算的速度优势,以求在处理速度和成像质量两方面均达到满意的效果。。主要的工作内容如下: 本文首先介绍了彩色滤波阵列、图像色彩恢复和插值算法的概念,然后分析和研究了当下常用的颜色插值算法,如双线性插值算法、加权系数法等等,指出了各个算法的特点和不足;接下来针对硬件系统并行运算的特性和实时性处理的要求,结合其中两种算法的思路设计了适用于硬件的改进算法,该算法主要引入了方向标志位的概念以及平滑的边界仲裁法则来检测边界,借鉴利用梯度的三角函数关系来判断边界方向,通过简化且适用于硬件的方法计算加权系数,从而选择合适的方向进行插值。 在介绍了FPGA用于图像处理的优势后,针对FPGA的特点采用模块化结构设计,详细阐述了本文算法的软件实现过程及所使用到的关键技术;文章设计了一个以FPGA为核心的前端图像采集平台,并将改进插值算法应用到整个系统当中。详细分析了采集前端的硬件需求,讨论了核心芯片的选型和硬件平台设计中的注意事项,完成了印制电路板的制作。 文章通过MATLAB仿真得到了量化的性能评估数据,并选取几种算法在硬件平台上运行,得到了实验图片。最后结合图片的视觉效果和仿真数据对几种不同算法的效果进行了评估和比较,证明改进的算法对图像质量有所增强,取得了良好的效果。
上传时间: 2013-06-11
上传用户:it男一枚
在网格环境中,如何对任务进行高效调度是当前研究的热点问题。目前Min-Min调度算法是一个简单、快速、有效的算法,但它很难满足网格任务对服务质量的要求。在独立型的任务调度模型的基础上,提出了一种基于权值的改进Min-Min调度算法。改进后的算法通过量化网格任务的优先级和等待时间,解决了原有算法存在的高质量任务和大任务等待时间过长的问题。仿真实验结果表明,改进后的算法满足了网格任务对优先级和等待时间的服务质量要求,是一种网格环境下有效的任务调度算法。
上传时间: 2014-12-29
上传用户:shenlan
LVQ算法( Learning Vector Quantization,学习矢量量化网络)是一种基于模型(神经网络)的方法,本实验要实现的是对LVQ改进的聚类方法——MLVQ(闫德勤等人提出)。该方法克服了LVQ算法对初值敏感的问题和广义学习矢量量化(GLVQ)网络算法性能不稳定的缺点。(附文章)
标签: Quantization Learning Vector LVQ
上传时间: 2015-08-31
上传用户:youke111
Marr边缘检测算法的研究,,提出了不等间隔采样和非均匀量化相结合的数字化方法
上传时间: 2014-11-10
上传用户:CHINA526