本文采用基于运动补偿的算法,对去隔行系统及其FPGA设计作了深入的研究.该系统包括三个关键模块运动估计模块是去隔行系统的设计重点,设计为双向运动估计,采用菱形快速搜索算法,主要分为计算和控制两大部分.计算部分为SAD计算模块,采用累加树和流水线技术;控制部分根据菱形搜索算法的第三步搜索的特点,对比较模块、SAD暂存器等模块做了具体的设计.对于运动补偿模块采用双向补偿的算法,补偿精度为半像素.根据半像素点的位置将运动补偿计算分为四个状态,并通过对四个状态计算特点的分析设计了加法器的结构复用.同时基于视频数据处理的需要,设计了四个具有双体存储结构的内部缓存器,由FPGA内部的嵌入式阵列块实现.根据运动估计模块和运动补偿模块的计算特点,分别对缓存器的结构、读写时序和列序号控制进行设计,有效提高了数据的存取效率.本文对于这三个去隔行系统的关键模块都给出了RTL级设计和模块的功能仿真,并在最后一章中给出了去隔行系统的FPGA设计.
上传时间: 2013-06-11
上传用户:han_zh
随着数字化技术的飞速发展,数字视频信号的传输技术更是受到人们的关注。相比较其它类型的信息传输如文本和数据,视频通信需要占用更多的带宽资源,因此为了实现在带宽受限的条件下的传输,视频源必须经过大量压缩。尽管现在的网络状况不断地改善,但相对与快速增长的视频业务而言,网络带宽资源仍然是远远不够的。2003年3月,新一代视频压缩标准H.264/AVC的推出,使视频压缩研究进入了一个新的层次。H.264标准中包含了很多先进的视频压缩编码方法,与以前的视频编码标准相比具有明显的进步。在相同视觉感知质量的情况下,H.264的编码效率比H.263提高了一倍左右,并且有更好的网络友好性。然而,高编码压缩率是以很高的计算复杂度为代价的,H.264标准的计算复杂度约为H.263的3倍,所以在实际应用中必须对其算法进行优化以减低其计算复杂度。 @@ 本文首先介绍了H.264标准的研究背景,分析了国内外H.264硬件系统的研究现状,并介绍了本文的主要工作。 @@ 接着对H.264编码标准的理论知识、关键技术分别进行了介绍。 @@ 对H.264块匹配运动估计算法进行研究,对经典的块匹配运动估计算法通过对比分析,三步、二维等算法在搜索效率上优于全搜索算法,而全搜索算法在数据流的规则性和均匀性有着自己的优越性。 @@ 针对块匹配运动估计全搜索算法的VLSI结构的特点,提出改进的块匹配运动估计全搜索算法。本文基于对数据流的分析,对硬件寻址进行了研究。通过一次完整的全搜索数据流分析,改进的块匹配运动估计算法在时钟周期、PE资源消耗方面得到优化。 @@ 最后基于FPGA平台对整像素运动估计模块进行了研究。首先对运动估计模块结构进行了功能子模块划分;然后对每个子模块进行设计和仿真和对整个运动估计模块进行联合仿真验证。 @@关键词:H.264;FPGA;QuartusⅡ;帧间预测;运动估计;块匹配
上传时间: 2013-04-24
上传用户:zttztt2005
H.264/AVC是由ITU和ISO两大组织联合组成的JVT共同制定的一项新的视频压缩技术标准,在较低带宽上提供高质量的图像传输是H.264/AVC的应用亮点。在同样的视觉质量前提下,H.264/AVC比H.263和MPEG-4节约了50%的码率。但H.264获得优越性能的代价是计算复杂度的增加,据估计其编码的计算复杂度大约为H.263的3倍,因此很难应用于实时视频处理领域。针对这一现状,业内做了大量的研究工作,力图降低其计算复杂度和提高运行效率。比如在运动估计方面,国内外在这方面的研究已经很成熟。而针对帧内/帧间预测编码的研究却较少。因此研究预测模式的快速算法具有理论意义和应用价值。 本文在详细研究H.264标准视频压缩编码特点基础上,分析了H.264帧内编码, 帧间编码及变换,量化技术的原理及特点,提出了一种基于局部边缘方向信息的快速帧内模式判决算法,通过结合SAD的模式选择方法来减少模式选择数目。它采用了Sobel梯度算子计算当前块的边缘信息,累加当前块中属于同一方向像素点的边缘矢量构造不同模式下的边缘方向直方图,以便确定最可能的预测模式。该算法有效降低了编码器的运算复杂度,在并未显著降低编码性能的情况下提升了编码器效率。仿真表明:Foreman 图像序列编码性能有了提高,其中PSNR平均降低了0.06dB,Bitrate平均降低了19.4%,这大大提高了视频传输的质量。 另外在帧间预测模式选择算法方面进行了改进研究:按顺序对不同类型进行判决,有选择地去比较可能模式,使得在有效减少需判决的模式数量的同时,结合小块模式搜索中途停止准则来确定最优模式。仿真表明:改进算法相对与原来算法能够节省很多的编码时间(平均下降了49.3%),但带来的图像质星的下降(平均下降0.08dB,可以忽略)和码率较少的增加。 同时在整数DCT变换模块中,提出了一种快速蝶形算法,使得对4×4点数据做一次变换,只需通过8×8次加法和2×8次移位运算便可完成,与原来12×8次加法和4×8次移位相比,新算法大大降低了运算复杂度。 最后介绍FPGA的特点及设计流程,并实现了H.264编解码器中变换编码及量化和熵解码模块的硬件。这种基于FPGA所实现的H.264编码视频处理模块设计具备了成本低,周期短,设计方法灵活等优点,具有广阔的市场应用前景。 仿真表明,通过使用本文提出的帧内/帧间速算法方法可使得H.264编码速度获得显著的提高,使H.264 Baseline编码器能在PC平台上实现实时编码。
上传时间: 2013-07-18
上传用户:zukfu
网络带宽依然在不断增长(尤其是在本地网),最后一公里的高速接入日益普及;另一方面的情况是大容量的磁盘、FLASH移动存储盘和激光盘的容量不断增大,使得传送和储存数据的成本不断地下降。不仅使人发问:我们孜孜不倦的搞视频压缩高级算法还有多少意义?我们可以看到,算法的复杂性日益增加,但性能的提高却接近边缘。 是什么还在要求更高的压缩速率?还有被我们遗忘的地方吗?还有什么应用让我们继续追求更精妙的压缩算法? 在作者看来,这个应用领域就是移动视频服务。无线频谱这种稀缺资源的有限性决定了我们必须继续对视频压缩技术进行研究。即使伴随UMTS/IMT2000的到来,移动终端可以获得的数据速率也限制在144Kbit/s,在微蜂窝的时候最高能达到的速率上限也在2Mbit/s。144Kbit/s的速率对于较高质量的视频传输来讲,仍然是有限的。因此,可以预见,移动终端的空中接口这个瓶颈使得我们必须继续进行视频压缩。 另一方面,移动终端领域开发视频压缩算法,在其低功耗和实时性要求下,也是异常困难的。为了减少计算的复杂性和运动估计的功耗,业界提出了许多快速算法,例如2-D的对数搜索,三步搜索,联合搜索。尽管这些方法减少了功耗,其结果是视频压缩性能的降低,因为这些算法的本质是减少了运动搜索的空间。为了实现运动搜索的低功耗,在电路领域又提出了搜索窗口和时钟管理的措施。但这些方法都是在牺牲视频压缩比性能的基础进行的折中,并没有强调算法映射结构上做出处理。 本论文提出了一种新的解决MPEG-4运动估计运算的低功耗实时处理器架构。其基础是采用了心肌阵列并行处理技术和低功耗控制电路。运动估计的繁复运算通过心肌阵列分布式运算得到有效处理。从理论上看,心肌阵列有其简单易理解性,然后,由于FPGA的互联网络有限性,设计这样一个阵列仍有许多值得注意的问题。论文提出使用保守近似处理在全局运动估计中减少功耗,其本质是消除不必要的冗余运算。宏块的最小误差匹配是一个典型的串行操作过程。论文新提出的方法是在进行绝对匹配前使用保守计算,如果保守误差值与最小误差差别过大,则不进行绝对误差计算。 总的说来,论文实现了两个目标:通过心肌阵列实现了实时的运动估计编码,通过在算法层次引入控制电路,降低运动估计电路的功耗。
上传时间: 2013-06-23
上传用户:lacsx
嵌入式系统是以应用为中心,以计算机为基础,并且软硬件可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。嵌入式系统一般由嵌入式微处理器、外围硬件设备、嵌入式操作系统以及用户的应用程序4部分组成,用于实现对其它设备的控制、监视或管理等功能。其广泛应用于控制领域、消费电子产品等行业,已成为现代电子领域的重要研究方向之一。而随着电子技术,多媒体技术及网络技术快速发展,视频监控系统也正在向嵌入式,数字化,网络化方向发展。嵌入式视频监控系统充分利用大规模集成电路和网络的科技成果,实现体积小巧,性能稳定,通讯便利的监控产品。本项的目的正是建立一个完整的基于 ARM9 核心处理器和嵌入式 Linux 操作系统的嵌入式视频监控系统。 本项目是在 ARM 微处理器平台上,移植嵌入式Linux操作系统,并完成视频采集、压缩、传输任务。系统采用 ARM 微处理器 AT91RM9200作为主处理器,以视频采集芯片 ADV7181 作为视频采集设备,用 H.263视频压缩协议对视频数据进行压缩,最后通过中兴通信公司 MG815+CDMA通信模块传输到服务器上。 本论文主要分成五个章节: 第一章:首先介绍ARM和嵌入式Linux操作系统的特点和当前的发展概况,然后说明了本文的课题背景及意义; 第二章:描述了硬件开发平台。本系统采用了 ALTMEL 的AT91RM9200为核心的开发平台,并扩展了以视频采集模块和CDMA无线传输模块; 第三章:描述了本系统的软件开发平台,包括嵌入式Linux开发流程以及移植到具体硬件平台需要完成的工作,如 U-Boot 的移植、Linux内核的编译与裁剪、文件系统的制作等; 第四章:首先论述了本系统中的难点 FIFO 设备的驱动编写,随后在对H.263视频压缩编码叙述的基础上针对块匹配运动估计给出了一种改进的菱形搜索算法代替原有的三步搜索法,并且通过实验结果证明,经算法改进优化的新菱形算法优于原先的三步搜索法; 第五章:得出了实验结果,完成了视频数据的无线网络传输。
上传时间: 2013-04-24
上传用户:martinyyyl
在当今的广播系统中,绝大部分的视频信号是隔行采样的。采用这种扫描格式,能够大幅度地减少视频的带宽,但也会引起彩色爬行、画面闪烁、边缘模糊及锯齿等现象。这种缺陷经人尺寸屏幕放大后就更加明显。为改善画面的视觉效果,去隔行技术应运而生。同时,视频信号本身的低帧频也会导致行抖动、线爬行以及大面积闪烁等视觉效果上的缺陷。增加扫描频率会把这些视觉缺陷搬移到人眼不敏感的高频区域上去从而产生较好的主观图象质量。而为了适应不同显示终端以及对图像大小变化的要求就必须对原始信号分辨率即每帧行数和每行像素数进行变换。因此去隔行、帧频转换、分辨率变换成为视频格式转换的基本内容。 FPGA 的出现是VLSI技术和EDA技术发展的结果。FPGA器件集成度高、体积小,具有通过用户编程实现专门应用的功能。它允许电路设计者利用基于计算机的开发平台,经过设计输入、仿真、测试和校验,直到达到预期的结果。使用FPGA器件可以大大缩短系统的研制周期,减少资金投入。另外采用FPGA器件可以将原来的电路板级产品集成芯片级产品,从而降低了功耗,提高了可靠性,同时还可以很方便的对设计进行在线修改。 该文在介绍了视频格式转换中的主要算法后,重点对去隔行、帧频转换、分辨率变换的FPGA综合实现方案进行了由简单到复杂的深入研究,分别给出了最简解决方案、基于非线性算法的解决方案和基于运动补偿的解决方案。最简解决方案利用线性算法将去隔行,帧频转换,分辨率变换三项处理同时实现,达到FPGA内部资源和外部RAM耗用量都为最小的要求,是后续复杂方案的基础。其中去隔行采用场合并方式,帧频转换采用帧重复方式,分辨率变换采用均匀插值方式。基于非线性算法的解决方案中加入了对静止区域的判断,静止区域的输出像素值直接选用相应位置的已存输入数据,非静止区域的输出像素值通过对已存输入数据进行非线性运算得出。基于运动补偿的解决方案在对静止区域进行判断和处理的基础上,对欲生成的变频后的场间插值帧进行运动估计,根据运动矢量得出非静止区域的输出像素值。其中为求得输入场间相应时间位置上的插值帧输出数据,该方案采用了自定义的前后向块匹配运动估计方式,通过对三步搜索算法的高效实现,将SAD 值进行比较得出运动矢量。
上传时间: 2013-07-19
上传用户:米卡
在信息化发展的当前,音视频等多媒体作为信息的载体,在社会生活的各个领域,起着越来越重要的作用。数字视频的海量性成为阻碍其应用的的瓶颈之一。在这种情况下,H.264作为新一代的视频压缩标准,以其高性能的压缩效率,成为备受关注的焦点和研究问题。H.264通过运动估计/运动补偿(MP/MC)消除视频时间冗余,对差值图像进行离散余弦变换(DCT)消除空间冗余,对量化后的系数进行可变长编码(VLC)消除统计冗余,获得了极高的压缩效率。随着嵌入式处理器性能的逐渐提升和3G网络即将商用的推动,H.264以其优秀的压缩性能,无论是无线信道传输方面,还是存储容量有限的嵌入式设备都具有广阔的应用前景。 但H.264在提升压缩性能的同时付出的代价是算法复杂度的成倍增加,实际应用中人们对视频解码的实时性要求严格,已出现的对应算法代码多基于PC通用处理器实现,而嵌入式设备的主频和处理能力仍然相对有限,存储容量相对较小,总线速率相对偏低,因此必须对标准对应算法进行优化移植,才能满足实际应用的需求。 本文在对H.264标准及其新特性进行详细介绍后,重点研究了在解码端如何针对解码耗时较多的模块进行改进,然后将算法移植到ARM平台,并针对平台特点作出相应优化,最后完成解码图象显示,并给出了测试结果。本文主要完成的工作如下: 详细分析了H.264的参考软件JM中解码流程,并利用测试工具分析了各模块耗时,针对耗时较多的模块如插值运算及去块滤波模块,提出了对应的改进算法并在H.264的参考软件JM86上进行了实现,PC测试实验证明了算法改进的优越性和运算优化的可行性。最后针对ARM平台,在对程序结构和对应代码进行优化之后,将其移植到WINCE系统之下,同时给出了WINCE平台解码后图象加速显示方法,并对最终测试结果与性能做出了评价。
上传时间: 2013-06-04
上传用户:shijiang
数字视频监控系统是一门集计算机技术、通信技术和数字视频技术于一体的综合系统,它充分利用大规模集成电路和网络的科技成果,体积小巧、性能稳定、通讯便利,被广泛应用于交通、银行、医院、视频会议、无人监控等诸多领域。 本系统基于ARM微处理器平台,移植嵌入式Linux操作系统,并完成视频采集、压缩、传输等任务。为降低产品成本,系统采用ARM9微处理器S3C2410作为主处理器,以USB摄像头作为视频采集设备,用软件对视频数据进行MPEG—4压缩。 论文首先从整体上分析了嵌入式数字视频监控系统的总体设计方案,给出了硬件框架和软件体系。其次在ARM硬件平台成功构建了armlinux嵌入式系统,包括引导程序Bootloader的设计、修改配置Linux内核以及制作JFFS2文件系统,完成USB数码摄像头的驱动。在应用程序开发过程中,设计了基于Video4Linux的视频采集程序,采用mmap(内存映射)方式截取图片,分析了MPEG—4编码模型XVID程序中的运动估计部分,研究了半像素快速搜索算法,从而减少了搜索点数提高了运算速度。最后利用开源JRTPLIB库实现视频数据流的RTP传送。 整个设计是在S3C2410硬件平台上进行的,采用2.4.18版本的Linux内核。其中MPEG—4编码优化测试是在ARMDeveloperSuite(ADS)version1.2中完成的。 本课题为在ARM平台实现数字视频监控的设计做了有益的探索性尝试,对今后进一步完成远程嵌入式视频监控系统的设计有着积极的意义。
上传时间: 2013-06-10
上传用户:shawvi
视频监控系统是一门集计算机技术、通信技术和数字视频技术于一体的综合系统。目前视频监控正向着数字化、网络化的方向发展。实现基于网络的视频监控系统的关键是一种嵌入式设备,它应该能够采集压缩视频数据并通过网络进行传输。 本文介绍了一种基于嵌入式Linux的网络视频监控系统的设计和实现方法。首先从整体上分析了网络视频监控系统的总体设计方案,给出了视频服务器的硬件框架和软件体系,并重点讨论了在ARM处理器上实现MPEG-4压缩编码的方法。其次在ARM硬件平台成功构建了armlinux嵌入式系统:包括引导程序Bootloader的设计、修改配置linux内核以及制作JFFS2文件系统。其中创新地提出了从nandflash启动U-BOOT具体设计方法。为了完成系统进一步的视频采集工作,系统实现了USB数码摄像头的驱动。在应用程序开发过程中,首先设计了基于Vide04Linux的视频采集程序,并采用mmap(内存映射)方式截取图片。其次重点分析了MPEG-4编码模型XVID程序中的运动估计部分,并研究了半像素快速搜索算法,从而减少了搜索点数提高了运算速度。最后利用开源JRTPLIB库实现视频数据流的RTP传送。 整个设计都是在深圳旋极公司研制的SUPER-ARM硬件平台上进行的,linux内核采用2.4.18。其中MPEG-4编码优化测试是在ARM DeveloperSuite(ADS)version 1.2中完成。 本课题为在ARM平台实现网络视频监控的设计做了有益的探索性尝试,对今后进一步完成远程嵌入式视频监控系统的设计有着积极的意义。
上传时间: 2013-07-21
上传用户:Altman
H.264/AVC是ITU-T和ISO联合推出的新标准,采用了近几年视频编码方面的先进技术,以较高编码效率和网络友好性成为新一代国际视频编码标准。 本文以实现D1格式的H.264/AVC实时编码器为目标,作者负责系统架构设计,软硬件划分以及部分模块的硬件算法设计与实现。通过对H.264/AVC编码器中主要模块的算法复杂度的评估,算法特点的分析,同时考虑到编码器系统的可伸缩性,可扩展性,本文采用了DSP+FPGA的系统架构。DSP充当核心处理器,而FPGA作为协处理器,针对编码器中最复杂耗时的模块一运动估计模块,设计相应的硬件加速引擎,以提供编码器所需要的实时性能。 H.264/AVC仍基于以前视频编码标准的运动补偿混合编码方案,其中一个主要的不同在于帧间预测采用了可变块尺寸的运动估计,同时运动向量精度提高到1/4像素。更小和更多形状的块分割模式的采用,以及更加精确的亚像素位置的预测,可以改善运动补偿精度,提高图像质量和编码效率,但同时也大大增加了编码器的复杂度,因此需要设计专门的硬件加速引擎。 本文给出了1/4像素精度的运动估计基于FPGA的硬件算法设计与实现,包括整像素搜索,像素插值,亚像素(1/2,1/4)搜索以及多模式选择(支持全部七种块分割模式)。设计中,将多处理器技术和流水线技术相结合,提供高性能的并行计算能力,同时,采用合理的存储器组织结构以提供高数据吞吐量,满足运算的带宽要求,并使编码器具有较好的可伸缩性。最后,在Modelsim环境下建立测试平台,完成了对整个设计的RTL级的仿真验证,并针对Altera公司的FPGA芯片stratixⅡ系列的EP2S60-4器件进行优化,从而使工作频率最终达到134MHz,分析数据表明该模块能够满足编码器的实时性要求。
上传时间: 2013-07-24
上传用户:sn2080395