现代数字信号处理对实时性提出了很高的要求,当最快的数字信号处理器(DSP)仍无法达到速度要求时,唯一的选择是增加处理器的数目,或采用客户定制的门阵列产品。随着可编程逻辑器件技术的发展,具有强大并行处理能力的现场可编程门阵列(FPGA)在成本、性能、体积等方面都显示出了优势。本文以此为背景,研究了基于FPGA的快速傅立叶变换、数字滤波、相关运算等数字信号处理算法的高效实现。 首先,针对图像声纳实时性的要求和FPGA片内资源的限制,设计了级联和并行递归两种结构的FFT处理器。文中详细讨论了利用流水线技术和并行处理技术提高FFT处理器运算速度的方法,并针对蝶形运算的特点提出了一些优化和改进措施。 其次,分析了具有相同结构的数字滤波和相关运算的特点,采用了有乘法器和无乘法器两种结构实现乘累加(MAC)运算。无乘法器结构采用分布式算法(DA),将乘法运算转化为FPGA易于实现的查表和移位累加操作,显著提高了运算效率。此外,还对相关运算的时域多MAC方法及频域FFT方法进行了研究。 最后,完成了图像声纳预处理模块。在一片EP2S60上实现了对160路信号的接收、滤波、正交变换以及发送等处理。实验表明,本论文所有算法均达到了设计要求。
上传时间: 2013-06-09
上传用户:zgu489
人脸自动识别技术是模式识别、图像处理等学科的一个最热门研究课题之一。随着社会的发展,各方面对快速有效的自动身份验证的要求日益迫切,而人脸识别技术作为各种生物识别技术中最重要的方法之一,已经越来越多的受到重视。对于具有实时,快捷,低误识率的高性能算法以及对算法硬件加速的研究也逐渐展开。 本文详细分析了智能人脸识别算法原理,发展概况和前景,包括人脸检测算法,人眼定位算法,预处理算法,PCA和ICA 算法,详细分析了项目情况,系统划分,软硬件平台的资源和使用。并在ISE软件平台上,用硬件描述语言(verilog HDL)对算法部分严格按照FPGA代码风格进行了RTL 硬件建模,并对C++算法进行了优化处理,通过仿真与软件算法结果进行比对,评估误差,最后在VirtexII Pro FPGA 上进行了综合实现。 主要研究内容如下: 首先,对硬件平台xilinx的VirtexII Pro FPGA 上的系统资源进行了描述和研究,对存储器sdram,RS-232 串口,JTAG 进行了研究和调试,对Coreconnect的OPB总线仲裁机理进行了两种算法的比较,RTL 设计,仿真和综合。利用ISE和VC++软件平台,对verilog和C++算法进行同步比较测试,使每步算法对应正确的结果。对软硬件平台的合理使用使得在项目中能尽可能多的充分利用硬件资源,制板时正确选型,以及加快设计和调试进度。其次,对人脸识别算法流程中的人脸检测,人眼定位,预处理,识别算法分别进行了比较研究,选取其中各自性能最好的一种算法对其原理进行了分析讨论。人脸检测采用adaboost 算法,因其速度和精度的综合性能表现优异。人眼定位采用小块合并算法,因为它具有快速,准确,弱时实的特点。预处理算法采用直方图均衡加平滑的算法,简单,高效。 识别算法采用PCA 加ICA 算法,它能最大的弱化姿态和光照对人脸识别的影响。 最后,使用Verilog HDL 硬件描述语言进行算法的RTL 建模,在C++算法的基础上,保证原来效果的前提下,根据FPGA 硬件特点对算法进行了优化。视频输入输出是人脸识别的前提,它提供FPGA 上算法需要处理的数据,预处理算法在C++算法的基础上进行了优化,最大的减少了运算量,提高了运算速度,16 位计算器模块使得在算法实现时可以根据系统要求,在FPGA的ip 核和自己设计的模块之间选择性能更好的一个来调用,FIFO的设计提供同步和异步时钟域的数据缓存。设计在ISE和VC++软件平台同时进行,随时对verilog和C++数据进行监测和比对。全部设计模块通过仿真,达到预定的性能要求,并在FPGA 上综合实现。
上传时间: 2013-07-13
上传用户:李梦晗
现代通信朝着全网IP化的进程逐步发展,越来越多的通信需要IP路由查找;同时光纤技术的发展,使得比特速率达到了20Gbps,路由技术成了整个通信系统的瓶颈,迫切需要一种具有高查找性能,低成本的路由算法,能够适应大规模应用。 本文研究了一种高性能、低成本的路由算法。在四分支并行路由查找算法的基础上,实现了双分支并行,每个分支流水查找的16-8-8路由算法。该算法由三级表构成,长度小于16的前缀通过扩展成为长度16的前缀存储在第一级表中;长度小于24位的前缀通过扩展成为长度24的前缀存储在前两级表中;长度大于24的前缀则通过专门的存储空间进行存储。将IP路由的二维查找转化为一维精确查找,每次查找最多访问存储器3次,就可以查得下一跳的路由信息。使用Verilog语言实现了本文提出的算法,并对算法进行了功能仿真。为了实现低成本,该算法采用了FPGA和SSRAM的硬件结构实现。 功能仿真表明本文设计的算法查找速度能适应20Gbps的接口转发速率。
上传时间: 2013-04-24
上传用户:金宜
Scaler是平板显示器件(FPD,Flat Panel Display)中的重要组成部分,它将输入源图像信号转换成与显示屏固定分辨率一致的信号,并控制其显示在显示屏上。本文在研究图像缩放算法和scaler在FPD中工作过程的基础上,采用自上而下(Top-down)的设计方法,给出了scaler的设计及FPGA验证。该scaler支持不同分辨率图像的缩放,且缩放模式可调,也可以以IP core的形式应用于相关图像处理芯片中。 图像缩放内核是scaler的核心部分,它是scaler中的主要运算单元,完成图像缩放的基本功能,它所采用的核心算法以及所使用的结构设计决定着缩放性能的优劣,也是控制芯片成本的关键。因此,本文从缩放内核的结构入手,对scaler的总体结构进行了设计;通过对图像缩放中常用算法的深入研究提出了一种新的优化算法——矩形窗缩放算法,并对其计算进行分析和简化,降低了计算的复杂度。FPGA设计中,采用列缩放与行缩放分开处理的结构,使用双口RAM作为两次缩放间的数据缓冲区。使用这种结构的优势在于:行列缩放可以同时进行,数据处理的可靠性高、速度快:内核结构简单明了,数据缓冲区大小合适,便于设计。此外,本文还介绍了其他辅助模块的设计,包括DVI接口信号处理模块、缩放参数计算与控制模块以及输出信号检测与时序滤波模块。 本设计使用Verilog HDL对各模块进行了RTL级描述,并使用Quartus II7.2进行了逻辑仿真,最后使用Altera公司的FPGA芯片来进行验证。通过逻辑验证和系统仿真,证明该scaler的设计达到了预期的目标。对于不同分辨率的图像,均可以在显示屏上得到稳定的显示。
上传时间: 2013-05-30
上传用户:xiaowei314
在几乎所有现代通讯和计算机网络领域中,安全问题都起着非常重要的作用。随着网络应用的迅速发展,对安全的要求也逐渐加强。目前影响最大的三类公钥密码是RSA公钥密码、EIGamal公钥密码和椭圆曲线公钥密码。但超椭圆曲线密码是比椭圆曲线密码更难攻破的密码体制,且可以在更小的基域上达到与椭圆曲线密码相同的安全程度。虽然超椭圆曲线密码体制在理论上已经基本成熟,但由于它的计算复杂性大,所以在具体实现上还需要进一步研究。实现超椭圆曲线密码系统,对于增强信息系统的安全性和研究更高强度的加密系统都有着重要的理论意义和较高的应用价值,相信超椭圆曲线密码系统将会有更好的应用前景。 对于密码系统,我们希望它占用的空间更少,实现的时间更短,安全性更高。论文研究超椭圆曲线密码中的加密算法,对主要算法进行实现比较并提出软硬协调思想实现超椭圆曲线密码系统就是为了达到这个目标。 论文先介绍了超椭圆曲线密码系统中有限域上的两个核心运算——有限域乘法运算和有限域求逆运算。对有限域乘法运算的全串行算法和串并混合算法在FPGA上用VHDL语言进行了实现,并对它们的结果进行对比,重点在于对并行度不同的串并混合算法进行实现比较,找到面积和速度的最佳结合点。通过对算法的实现和比较,发现理论上面积和速度协调性较好的8位串并混合算法在实际中协调性并不是很好,最终得出结论,在所做实验的四种情况中,面积和速度协调性较好的算法是4位串并混合算法。随后论文对有限域求逆运算的三种算法在FPGA上用VHDL语言进行实现比较,找到单独实现有限域求逆运算较好的算法(MIMA域求逆算法)和可以与域乘法运算相结合的算法(使用域乘法求逆的算法),为软硬协调实现超椭圆曲线系统思想的提出打下基础。 论文然后提出了软硬协调的方法实现超椭圆曲线系统的思想,并对整个系统进行了软硬件部分的划分。通过分析,将标量乘算法,除子算法和多项式环算法划分到软件部分,并对其中的标量乘运算进行了详细的分析介绍,将有限域算法归于硬件部分并对其进行了简单描述。在最后对全文进行总结,提出进一步需要开展的工作。
上传时间: 2013-04-24
上传用户:zl123!@#
LDPC(Low Density Parity Check)码是一类可以用非常稀疏的校验矩阵或二分图定义的线性分组纠错码,最初由Gallager发现,故亦称Gallager码.它和著名Turbo码相似,具有逼近香农限的性能,几乎适用于所有信道,因此成为近年来信道编码界研究的热点。 LDPC码的奇偶校验矩阵呈现稀疏性,其译码复杂度与码长成线性关系,克服了分组码在长码长时所面临的巨大译码计算复杂度问题,使长编码分组的应用成为可能。而且由于校验矩阵的稀疏特性,在长的编码分组时,相距很远的信息比特参与统一校验,这使得连续的突发差错对译码的影响不大,编码本身就具有抗突发差错的特性。 本文首先介绍了LDPC码的基本概念和基本原理,其次,具体介绍了LDPC码的构造和各种编码算法及其生成矩阵的产生方法,特别是准循环LDPC码的构造以及RU算法、贪婪算法,并在此基础上采用贪婪算法对RU算法进行了改进。 最后,选用Altera公司的Stratix系列FPGA器件EPls25F67217,实现了码长为504的基于RU算法的LDPC编码器。在设计过程中,为节省资源、提高速度,在向量存储时采用稀疏矩阵技术,在向量相加时采用通过奇校验直接判定结果的方法,在向量乘法中,采用了前向迭代方法,避开了复杂的矩阵求逆运算。结果表明,该编码器只占用约10%的逻辑单元,约5%的存储单元,时钟频率达到120MHz,数据吞吐率达到33Mb/s,功能上也满足编码器的要求。
上传时间: 2013-06-09
上传用户:66wji
卫星导航定位系统可以为公路、铁路、空中和海上的交通运输工具提供导航定位服务。它能够军民两用,战略作用与商业利益并举。只要持有便携式接收机,则无论身处陆地、海上还是空中,都能收到卫星发出的特定信号。接收机选取至少四颗卫星发出的信号进行分析,就能确定接收机持有者的位置。 GPS导航定位接收机的理论基础即是扩频通信理论,扩频通信技术与常规的通信技术相比,具有低截获率,强抗噪声,抗干扰性,具有信息隐蔽和多址通信等特点,目前己从军事领域向民用领域迅速发展,成为进入信息时代的高新技术通信传输方式之一。扩频通信技术中,最常见的是直接序列扩频通信(DSSS)系统,本文所研究的就是这一类系统。 目前在卫星信号的捕获上一般使用两种方法:顺序捕获方法(时域法,基于大规模并行相关器)和并行捕获方法(频域法,基于FFT)。本文在第二章分别分析了现有顺序捕获和并行捕获技术的原理,并给出了它们的优缺点。 本文第三章对长码的直接捕获进行了深入的研究,基于对国内外相关文献中长码直捕方法的分析与对比,并且结合在实际过程中硬件资源需求的考虑,应用了基于分段补零循环相关和FFT搜索频偏的直捕方法。此方法大大减少了计算量,加快了信号捕获的速度。本方法利用FFT实现接收信号与本地长码的并行相关,同时完成频偏的搜索,将传统的二维搜索转换为并行的一维搜索,从而能快速实现长码捕获。 GPS信号十分微弱,灵敏度低,在战场环境下,GPS接收机会面临各种人为的干扰。如何从复杂的干扰信号中实现对GPS信号的捕获,即抗干扰技术的研究,是GPS也是本文研究一个的方面。第四章即研究了GPS接收机干扰抑制算法,在强干扰环境下,需要借助信号处理技术在不增加信号带宽的条件下提高系统的抗干扰能力,以保证后续捕获跟踪模块有充足的处理增益。 本文在第五章给出了GPS接收机长码捕获以及干扰抑制的FPGA实现方案,并对各主要子模块进行了详细地分析。基本型接收机中长码捕获采用频域方法,选用Altera StratixⅡ EP2S180芯片实现;抗干扰型接收机中选用Xilinx xc4vlx100芯片。实现了各模块的单独测试和整个系统的联调,通过联调验证,本文提出的长码直接捕获方法正确、可行。 本文提出的长码直捕方法可以在不需要C/A码辅助捕获下完成对长码的直接捕获,可以应用于GPS接收机,监测站接收机的同步等,对我国自主研发导航定位接收机也有重大的现实及经济意义。
上传时间: 2013-06-18
上传用户:wang5829
随着计算机科学在人机交互领域的极大发展,作为人脸信息处理中的一项关键技术,人脸检测现在已经成为模式识别,计算机视觉和人机交互领域不可缺少的一部分。但是,人脸检测算法存在计算量大、速度慢等缺点。软件实现方式无法达到实时处理要求,而现有的硬件实现需要占用大量硬件资源。 本文针对现有人脸检测硬件实现的缺点,通过对Adaboost算法和现有硬件结构的分析,提出了双流水线硬件检测架构:扫描窗口流水线、特征向量流水线。并在Vertex-II Pro FPGA平台验证成功,达到实时检测的标准。具体工作和创新点包括如下几点: 介绍了人脸检测的原理以及人脸检测经典算法。其中,详细介绍了Adaboost算法。 对现有的结构进行详细分析。指出现有各架构的缺点,即资源占用多,检测速度慢。针对这两个问题,本文提出了一个适合嵌入式应用的扫描窗口、特征向量双流水线检测硬件架构,详细说明了该架构的工作原理,并在该架构基础上,通过加入预测加载技术,进一步提高检测速度。随后,采用存储器访问效率,架构内部存储单元大小,检测时间长短,运算单元数量四个标准,详细比较了新架构和现有架构的差别,显示出新架构的优势。 基于提出的架构,给出了Adaboost人脸检测系统的VLSI实现方案。本文中,采用自顶向下的设计方法将人脸检测系统分成若干个子模块,然后对每个子模块进行详细的设计和说明,给出了每个子模块的硬件架构、状态转换以及verilog实现后的仿真波形。 采用Xilinx公司的VII Pro FPGA开发板完成人脸检测系统的硬件验证。FPGA验证结果表明对于QCIF分辨率的视频图像,人脸检测系统能够达到50fps的检测速度,满足实时检测的要求。
上传时间: 2013-06-15
上传用户:1193169035
H.264/AVC是国际电信联盟与国际标准化组织/国际电工委员会联合推出的活动图像编码标准,简称H.264。作为最新的国际视频编码标准,H.264/AVC与MPEG-4、H.263等视频编码标准相比,性能有了很大的提高,并已在流媒体、数字电视、电话会议、视频存储等诸多领域得到广泛的应用。 本论文的研究课题是基于H.264/AVC视频编码标准的CAVLC(Context-based Adaptive Variable Length Coding,基于上下文的自适应可变长编码)编码算法研究及FPGA实现。对于变换后的熵编码,H.264/AVC支持两种编码模式:基于上下文的可变长编码(CAVLC)和基于上下文的自适应算术编码(CABAC,Context-based Adaptive BinaryArithmetic Coding)。在H.264/AVC中,尽管CAVLC算法也是采用了VLC编码,但是同以往标准不同,它所有的编码都是基于上下文进行。这种方法比传统的查单一表的方法提高了编码效率,但也增加了设计上的困难。 作者在全面学习H.264/AVC协议和深入研究CAVLC编码算法的基础上,确定了并行编码的CAVLC编码器结构框图,并总结出了影响CAVLC编码器实现的瓶颈。针对这些瓶颈,对CAVLC编码器中的各个功能模块进行了优化设计,这些优化设计包括多参考块的表格预测法、快速查找表法、算术消除法等。最后,用Verilog硬件描述语言对所设计的CAVLC编码器进行了描述,用EDA软件对其主要功能模块进行了仿真,并在Cyclone II系列EP2C20F484的FPGA上验证了它们的功能。结果表明,该CAVLC编码器各编码单元的编码速度得到了显著提高且均能满足实时通信要求,为整个CAVLC编码器的实时通信提供了良好的基础。
上传时间: 2013-06-22
上传用户:diamondsGQ
随着图像分辨率的越来越高,软件实现的图像处理无法满足实时性的需求;同时FPGA等可编程器件的快速发展使得硬件实现图像处理变得可行。如今基于FPGA的图像处理研究成为了国内外的一个热门领域。 本文在FPGA平台上,用Verilog HDL实现了一个研究图像处理算法的可重复配置的硬件模块架构,架构包括PC机预处理和通信软件,控制模块,计算单元,存储器模块和通信适配模块五个部分。其中的计算模块负责具体算法的实现,根据不同的图像处理算法可以独立实现。架构为计算模块实现了一个可添加、移出接口,不同的算法设计只要符合该接口就可以方便的加入到模块架构中来进行调试和运行。 在硬件架构的基础上本文实现了排序滤波,中值滤波,卷积运算及高斯滤波,形态学算子运算等经典的图像处理算法。讨论了FPGA的图像处理算法的设计方法及优化策略,通过性能分析,FPGA实现图像处理在时间上比软件处理有了很大的提高;通过结果的比较,发现FPGA的处理结果达到了软件处理几乎同等的效果水平。最后本文在实现较大图片处理和图像处理窗口的大小可配置性方面做了一定程度的讨论和改进,提高了算法的可用性,同时为进一步的研究提供了更加便利的平台。 整个设计都是在ISE8.2和ModelSim第三方仿真软件环境下开发的,在xilinx的Spartan-3E XC3S500E硬件平台上实现。在软件仿真过程中利用了ISE8.2自带仿真工具和ModelSim结合使用。 本课题为制造FPGA的专用图像处理芯片做了有益的探索性研究,为实现FPGA为核心处理芯片的实时图像处理系统有着积极的作用。
上传时间: 2013-07-29
上传用户:爱顺不顺