DFT(Discrete Fourier Transformation)是数字信号分析与处理如图形、语音及图像等领域的重要变换工具,直接计算DFT的计算量与变换区间长度N的平方成正比.当N较大时,因计算量太大,直接用DFT算法进行谱分析和喜好的实时处理是不切实际的.快速傅里叶变换(Fast Fourier Transformation,简称FFT)使DFT运算效率提高1~2个数量级.本文的目的就是研究如何应用FPGA这种大规模可编程逻辑器件实现FFT的算法.本设计主要采用先进的基-4DIT算法研制一个具有实用价值的FFT实时硬件处理器.在FFT实时硬件处理器的设计实现过程中,利用递归结构以及成组浮点制运算方式,解决了蝶形计算、数据传输和存储操作协调一致问题.合理地解决了位增长问题.同时,采用并行高密度乘法器和流水线(pipeline)工作方式,并将双端口RAM、只读ROM全部内置在FPGA芯片内部,使整个系统的数据交换和处理速度得以很大提高,实际合理地解决了资源和速度之间相互制约的问题.本设计采用Verilog HDL硬件描述语言进行设计,由于在设计中采用Xilinx公司提供的称为Core的IP功能块极大地提高了设计效率.
上传时间: 2013-06-20
上传用户:小码农lz
近些年来,FPGA已经成为现代电子、半导体行业的最重要组成部分之一,针对FPGA的综合技术的研究是电子设计自动化技术的重要研究方向。逻辑综合是FPGA综合的重要步骤,它包括逻辑优化和工艺映射。本文主要研究了针对一种新型ALM(Adaptive Logic Model)结构FPGA的工艺映射算法。 论文首先对已有FPGA逻辑综合技术进行了全面的总结,从逻辑优化和工艺映射两个方面分析了传统算法对ALM结构FPGA的适应性,通过分析我们得出结论,传统的逻辑优化算法仍然能够适用于ALM结构FPGA的逻辑综合,而工艺映射算法则需要进行改进。 在以上分析的基础上,根据ALM结构的特点,论文提出了一种以面积优化为主,同时考虑延迟的针对ALM结构FPGA的工艺映射算法——ALMmap。该算法包括几个子算法,递减迭代装箱算法能够很好的适应ALM结构的灵活性;通过ALM装箱算法并加入共享输入处理,将多个LUT装入一个ALM结构中;再汇聚路径的处理有助于提高效率和减少面积;算法在已有的多级分解算法基础上考虑了延迟因素,在不降低面积优化效果的同时降低了延迟;通过全局优化从全局范围对面积进行了进一步的优化。 最后,我们对ALMmap算法与传统算法进行了测试与比较,通过实验数据表明,ALMmap能够很好的发挥ALM结构的灵活性,考虑延迟的多级分解算法能够很好的降低延迟,与传统基于K-LUT的工艺映射算法相比,具有更好的面积与延迟综合性能。
上传时间: 2013-06-24
上传用户:hechao3225
H.264/AVC是ITU-T和ISO联合推出的新标准,采用了近几年视频编码方面的先进技术,以较高编码效率和网络友好性成为新一代国际视频编码标准。 本文以实现D1格式的H.264/AVC实时编码器为目标,作者负责系统架构设计,软硬件划分以及部分模块的硬件算法设计与实现。通过对H.264/AVC编码器中主要模块的算法复杂度的评估,算法特点的分析,同时考虑到编码器系统的可伸缩性,可扩展性,本文采用了DSP+FPGA的系统架构。DSP充当核心处理器,而FPGA作为协处理器,针对编码器中最复杂耗时的模块一运动估计模块,设计相应的硬件加速引擎,以提供编码器所需要的实时性能。 H.264/AVC仍基于以前视频编码标准的运动补偿混合编码方案,其中一个主要的不同在于帧间预测采用了可变块尺寸的运动估计,同时运动向量精度提高到1/4像素。更小和更多形状的块分割模式的采用,以及更加精确的亚像素位置的预测,可以改善运动补偿精度,提高图像质量和编码效率,但同时也大大增加了编码器的复杂度,因此需要设计专门的硬件加速引擎。 本文给出了1/4像素精度的运动估计基于FPGA的硬件算法设计与实现,包括整像素搜索,像素插值,亚像素(1/2,1/4)搜索以及多模式选择(支持全部七种块分割模式)。设计中,将多处理器技术和流水线技术相结合,提供高性能的并行计算能力,同时,采用合理的存储器组织结构以提供高数据吞吐量,满足运算的带宽要求,并使编码器具有较好的可伸缩性。最后,在Modelsim环境下建立测试平台,完成了对整个设计的RTL级的仿真验证,并针对Altera公司的FPGA芯片stratixⅡ系列的EP2S60-4器件进行优化,从而使工作频率最终达到134MHz,分析数据表明该模块能够满足编码器的实时性要求。
上传时间: 2013-07-24
上传用户:sn2080395
本文对基于FPGA的CCSDS图像压缩和AES加密算法的实现进行了研究。主要完成的工作有: (1)深入研究CCSDS图像压缩算法,并根据其编码方案,设计并实现了相应的编解码器。从算法性能和硬件实现复杂度两个方面,将该算法与具有类似算法结构的JPEG2000和SPIHT图像压缩算法作比较分析; (2)利用硬件描述语言VerilogHDL实现CCSDS图像压缩算法和AES加密算法; (3)优化算法复杂度较大的功能模块,如小波变换模块等。使用双端口内存模块增加数据读写速度,利用DSP块处理核心运算单元,从而很大程度上提高了模块的运行速度,并降低了芯片的使用面积; (4)设计并实现系统的模块级流水线,在几乎不增加占用芯片面积的情况下,提高了系统的数据吞吐量; (5)在QuartusⅡ和ModelSim仿真环境下对该系统进行模块级和系统级的功能仿真、时序仿真和验证。在硬件系统测试阶段,设计并实现FPGA与PC机的串口通信模块,提高了系统验证的工作效率。
上传时间: 2013-05-19
上传用户:1757122702
在雷达信号侦察中运用宽带数字接收技术是电子侦察的一个重要发展方向。数字信号处理由于其精度高、灵活性强、以及易于集成等特点而应用广泛。电子系统数字化的最大障碍是宽带高速A/D变换器的高速数据流与通用DSP处理能力的不匹配。而FPGA的广泛应用,为解决上述矛盾提供了一种有效的方法。 本文利用FPGA技术,设计了具备高速信号处理能力的宽带数字接收机平台,并提出了数字接收机实现的可行性方法,以及对这些方法的验证。具体来说就是如何利用单片的FPGA实现对雷达信号并行地实时检测和参数估计。所做工作主要分为两大部分: 1、适合于FPGA硬件实现的算法的确定及仿真:对A/D采样信号采用自相关累加算法进行信号检测,利用信号的相关性和噪声的独立性提高信噪比,通过给出检测门限来估计信号的起止点。对于常规信号的频率估计,采用Rife算法。通过Matlab仿真,表明上述算法在运算量和精度方面均有良好性能,适合用作FPGA硬件实现。 2、算法的FPGA硬件实现:针对原算法中极大消耗运算量的相关运算,考虑到FPGA并行处理的特点,将原算法修改为并行相关算法,并加入流水线,这样处理极大地提高了系统的数据吞吐率。采用Xilinx公司的Virtex-4系列中的XC4VSX55芯片作为开发平台完成设计,系统测试结果表明,本设计能正常工作,满足系统设计要求。 文章的最后,结合系统设计给出几种VHDL优化方法,主要围绕系统的速度、结构和面积等问题展开讨论。
上传时间: 2013-06-25
上传用户:songnanhua
本文对基于脉动阵列结构的RSA公钥密码协处理器进行了深入的研究,通过对Montgomery模乘思想的深入分析,确定了免减基2算法作为模乘运算实现算法,同时系统的研究了脉动阵列结构这一专用处理器设计模型,结合器件特性设计出一种适于在FPGA上实现的模乘运算电路结构,通过引入流水线技术,实现了两次模乘运算并行处理。在此基础上,引入可变参数的设计理念,完成了可变参数模幂运算电路的设计与实现工作,有效的提高了算法硬件实现的灵活性。
上传时间: 2013-07-16
上传用户:playboys0
ARM的体系结构英文版 关于ARM的历史发展和ARM的结构英文论文
上传时间: 2013-04-24
上传用户:xmsmh
ARM7体系结构白皮书,详细介绍ARM7的构架,总线结构,指令系统,作为arm7开发的权威指南
上传时间: 2013-04-24
上传用户:561596
心血管疾病是当今危害人类健康的主要疾病之一,心电图检查是临床上诊断心血管疾病的重要方法。心电图准确的自动分析与诊断对于心血管疾病的诊断起着关键的作用,也是国内外学者所热衷的研究课题。QRS复合波的检测是心电自动分析的关键环节,检出的位置精度关系到后续处理和分析的正确性和准确性。 本文在总结前人工作的基础上,对基于小波变换的QRS复合波检测算法做了深入研究;并针对小波变换算法与心电检测算法的结构提出了一种硬件实现方法。本文的主要内容包括基于小波变换的心电信号检测算法设计和该算法在FPGA系统上的实现两个部分。 对国内外近年内发展起来的各种心电检测方法进行了总结,并综合考虑检出率和硬件实现的实时性等问题,采用小波变换方法对QRS复合波进行检测。根据QRs复合波经小波变换后,心电特征波在某些尺度上对应有相对明显的模极值对,通过在对应尺度上判断模极值对,进而检测出对应的特征波。 设计了基于小波变换的心电信号检测算法的FPGA实现系统。系统主要包含三个模块:心电信号预处理模块、小波分解模块和检测模块。心电信号预处理模块对输入的心电信号进行滤波预处理,以消除工频干扰和基线漂移。小波分解模块采用流水线设计,即把各层小波分解分成各个模块独立实现,以提高运算效率。检测模块的功能是利用小波分解模块的输出结果在各尺度上寻找模极值对,并根据检测策略检测QRS复合波。 本文采用Veillog语言对设计进行了仿真验证,并通过MIT-BIH心律失常标准数据库对本文的设计实现进行性能评估,获得了较好的检出率。同时,综合结果也表明系统时钟能够工作在较高的频率,足以满足高速实时对心电信号的处理与检测。
上传时间: 2013-04-24
上传用户:daoxiang126
数字滤波器是现代数字信号处理系统的重要组成部分之一。ⅡR数字滤波器又是其中非常重要的一类虑波器,因其可以较低的阶次获得较高的频率选择特性而得到广泛应用。 本文研究了ⅡR数字滤波器的常用设计方法,在分析各种ⅡR实现结构的基础上,利用MATLAB针对并联型结构的ⅡR数字滤波器做了多方面的仿真,从理论分析和仿真情况确定了所要设计的ⅡR数字滤波器的实现结构以及中间数据精度。然后基于FPGA的结构特点,研究了ⅡR数字滤波器的FPGA设计与实现,提出应用流水线技术和并行处理技术相结合的方式来提高ⅡR数字滤波器处理速度的方法,同时又从ⅡR数字滤波器的结构特性出发,提出利用ⅡR数字滤波器的分解技术来改善ⅡR滤波器的设计。在ⅡR实现方面,本文采用Verilog HDL语言编写了相应的硬件实现程序,将内置SignalTap Ⅱ逻辑分析器的ⅡR设计下载到FPGA芯片,并利用Altera公司的SignalTap Ⅱ逻辑分析仪进行了定性测试,同时利用HP频谱仪进行定性与定量的观测,仿真与实验测试结果表明设计方法正确有效。
上传时间: 2013-04-24
上传用户:lmq0059