随着雷达、图像、通信等领域对信号高速处理的要求,研究人员正寻求高速的数字信号处理算法,以满足这种高速地处理数据的需要。常用的高速实时数字信号处理的器件有ASIC、可编程的数字信号处理芯片、FPGA,等等。 本文研究了时域FPGA上实现高速高阶FIR数字滤波器结构,并实现了高压缩比的LFM脉冲信号的匹配滤波。文章根据FIR数字滤波器理论,分析比较实现了FIR滤波器的方法;使用并行分布式算法,在Xilinx的VirtexⅡFPGA系列芯片上设计了高速高阶FIR滤波器。并详细进行了分析;设计出了一个256阶的线性调频脉冲压缩信号的匹配滤波器设计实例,并用ModelSim软件进行了仿真。
上传时间: 2013-07-18
上传用户:yt1993410
当前,在系统级互连设计中高速串行I/O技术迅速取代传统的并行I/O技术正成为业界趋势。人们已经意识到串行I/O“潮流”是不可避免的,因为在高于1Gbps的速度下,并行I/O方案已经达到了物理极限,不能再提供可靠和经济的信号同步方法。基于串行I/O的设计带来许多传统并行方法所无法提供的优点,包括:更少的器件引脚、更低的电路板空间要求、减少印刷电路板(PCB)层数、PCB布局布线更容易、接头更小、EMI更少,而且抵抗噪声的能力也更好。高速串行I/O技术正被越来越广泛地应用于各种系统设计中,包括PC、消费电子、海量存储、服务器、通信网络、工业计算和控制、测试设备等。迄今业界已经发展出了多种串行系统接口标准,如PCI Express、串行RapidIO、InfiniBand、千兆以太网、10G以太网XAUI、串行ATA等等。 Aurora协议是为私有上层协议或标准上层协议提供透明接口的串行互连协议,它允许任何数据分组通过Aurora协议封装并在芯片间、电路板间甚至机箱间传输。Aurora链路层协议在物理层采用千兆位串行技术,每物理通道的传输波特率可从622Mbps扩展到3.125Gbps。Aurora还可将1至16个物理通道绑定在一起形成一个虚拟链路。16个通道绑定而成的虚拟链路可提供50Gbps的传输波特率和最大40Gbps的全双工数据传输速率。Aurora可优化支持范围广泛的应用,如太位级路由器和交换机、远程接入交换机、HDTV广播系统、分布式服务器和存储子系统等需要极高数据传输速率的应用。 传统的标准背板如VME总线和CompactPCI总线都是采用并行总线方式。然而对带宽需求的不断增加使新兴的高速串行总线背板正在逐渐取代传统的并行总线背板。现在,高速串行背板速率普遍从622Mbps到3.125Gbps,甚至超过10Gbps。AdvancedTCA(先进电信计算架构)正是在这种背景下作为新一代的标准背板平台被提出并得到快速的发展。它由PCI工业计算机制造商协会(PICMG)开发,其主要目的是定义一种开放的通信和计算架构,使它们能被方便而迅速地集成,满足高性能系统业务的要求。ATCA作为标准串行总线结构,支持高速互联、不同背板拓扑、高信号密度、标准机械与电气特性、足够步线长度等特性,满足当前和未来高系统带宽的要求。 采用FPGA设计高速串行接口将为设计带来巨大的灵活性和可扩展能力。Xilinx Virtex-IIPro系列FPGA芯片内置了最多24个RocketIO收发器,提供从622Mbps到3.125Gbps的数据速率并支持所有新兴的高速串行I/O接口标准。结合其强大的逻辑处理能力、丰富的IP核心支持和内置PowerPC处理器,为企业从并行连接向串行连接的过渡提供了一个理想的连接平台。 本文论述了采用Xilinx Virtex-IIPro FPGA设计传输速率为2.5Gbps的高速串行背板接口,该背板接口完全符合PICMG3.0规范。本文对串行高速通道技术的发展背景、现状及应用进行了简要的介绍和分析,详细分析了所涉及到的主要技术包括线路编解码、控制字符、逗点检测、扰码、时钟校正、通道绑定、预加重等。同时对AdvancedTCA规范以及Aurora链路层协议进行了分析, 并在此基础上给出了FPGA的设计方法。最后介绍了基于Virtex-IIPro FPGA的ATCA接口板和MultiBERT设计工具,可在标准ATCA机框内完成单通道速率为2.5Gbps的全网格互联。
上传时间: 2013-05-29
上传用户:frank1234
在合成孔径雷达的研究和研制工作中,合成孔径雷达模拟技术具有十分重要的作用。本文以440MHz带宽线性调频信号,采样频率500MHz高分辨合成孔径雷达视频模拟器为研究对象。首先对模拟器的几项主要技术进行分析,在对点目标回波信号模型分析研究的基础上,对点目标原始回波数据进行模拟并做了成像验证,从而为硬件实现提供了正确的信号模型;针对传统的“波形存储直读法”方案,即在计算机平台上用模拟软件产生原始回波数据并存储,再通过计算机接口实现数据传输,最后完成数模转换产生视频信号这一过程,分析指出该方案在实现高分辨率时的速度和容量瓶颈。 针对具体的设计要求,围绕速度和容量问题,本文着眼于高分辨率SAR模拟器的FPGA实现研究,指出FPGA实时生成点目标原始回波数据是其实现的核心;针对这一核心问题,充分利用现代VLSI设计中的流水线技术与并行阵列技术以及FPGA的优良性能和丰富资源,在时间上采用同步流水结构、空间上采用并行阵列形式,将速度和容量问题统一为数据的高速生成问题;给出了系统总体设计思想,该方案不需要大容量存储器单元,大大减少模拟器复杂度;对原始回波数据实时生成模块的各主要单元给出了结构并进行了仿真,结果表明FPGA可以满足课题设计要求;同时,对该模拟器片上系统的实现、增强人机交互性,给出了人机界面的设计思路。 分析指出了点目标原始回波数据实时生成模块通过并行扩展即可实现多点目标的原始回波数据实时生成;最后对复杂场景目标模拟器的实现进行了构思,指出了传统方案在改进的基础上实现高分辨率视频模拟器的可行性。本文首次提出以FPGA实现高分辨率合成孔径雷达原始回波数据实时生成的思想,为国内业界在此方向做了一些理论和实践上的有益探索,对于国内高分辨率合成孔径雷达的研制具有一定的实际意义。
上传时间: 2013-04-24
上传用户:阿四AIR
随着移动终端、多媒体、Internet网络、通信,图像扫描技术的发展,以及人们对图象分辨率,质量要求的不断提高,用软件压缩难以达到实时性要求,而且会带来因传输大量原始图象数据带来的带宽要求,因此采用硬件实现图象压缩已成为一种必然趋势。而熵编码单元作为图像变换,量化后的处理环节,是图像压缩中必不可少的部分。研究熵编解码器的硬件实现,具有广阔的应用背景。本文以星载视频图像压缩的硬件实现项目为背景,对熵编码器和解码器的硬件实现进行探讨,给出了并行熵编码和解码器的实现方案。熵编解码器中的难点是huffman编解码器的实现。在设计并行huffman编码方案时通过改善Huffman编码器中变长码流向定长码流转换时的控制逻辑,避免了因数据处理不及时造成数据丢失的可能性,从而保证了编码的正确性。而在实现并行的huffman解码器时,解码算法充分利用了规则化码书带来的码字的单调性,及在特定长度码字集内码字变化的连续性,将并行解码由模式匹配转换为算术运算,提高了存储器的利用率、系统的解码效率和速度。在实现并行huffman编码的基础上,结合针对DC子带的预测编码,针对直流子带的游程编码,能够对图像压缩系统中经过DWT变换,量化,扫描后的数据进行正确的编码。同时,在并行huffman解码基础上的熵解码器也可以解码出正确的数据提供给解码系统的后续反量化模块,进一步处理。在本文介绍的设计方案中,按照自顶向下的设计方法,对星载图像压缩系统中的熵编解码器进行分析,进而进行逻辑功能分割及模块划分,然后分别实现各子模块,并最终完成整个系统。在设计过程中,用高级硬件描述语言verilogHDL进行RTL级描述。利用了Altera公司的QuartusII开发平台进行设计输入、编译、仿真,同时还采用modelsim仿真工具和symplicity的综合工具,验证了设计的正确性。通过系统波形仿真和下板验证熵编码器最高频率可以达到127M,在62.5M的情况下工作正常。而熵解码器也可正常工作在62.5M,吞吐量可达到2500Mbps,也能满足性能要求。仿真验证的结果表明:设计能够满足性能要求,并具有一定的使用价值。
上传时间: 2013-05-19
上传用户:吴之波123
逆变控制器的发展经历从分立元件的模拟电路到以专用微处理芯片(DSP/MCU)为核心的电路系统,并从数模混合电路过渡到纯数字控制的历程。但是,通用微处理芯片是为一般目的而设计,存在一定局限。为此,近几年来逆变器专用控制芯片(ASIC)实现技术的研究越来越受到关注,已成为逆变控制器发展的新方向之一。本文利用一个成熟的单相电压型PWM逆变器控制模型,围绕逆变器专用控制芯片ASIC的实现技术,依次对专用芯片的系统功能划分,硬件算法,全系统的硬件设计及优化,流水线操作和并行化,芯片运行稳定性等问题进行了初步研究。首先引述了单相电压型PWM逆变器连续时间和离散时间的数学模型,以及基于极点配置的单相电压型PWM逆变器电流内环电压外环双闭环控制系统的设计过程,同时给出了仿真结果,仿真表明此系统具有很好的动、静态性能,并且具有自动限流功能,提高了系统的可靠性。紧接着分析了FPGA器件的特征和结构。在给出本芯片应用目标的基础上,制定了FPGA目标器件的选择原则和芯片的技术规格,完成了器件选型及相关的开发环境和工具的选取。然后系统阐述了复杂FPGA设计的设计方法学,详细介绍了基于FPGA的ASIC设计流程,概要介绍了仅使用QuartusII的开发流程,以及Modelsim、SynplifyPro、QuartusII结合使用的开发流程。在此基础上,进行了芯片系统功能划分,针对:DDS标准正弦波发生器,电压电流双环控制算法单元,硬件PI算法单元,SPWM产生器,三角波发生器,死区控制器,数据流/控制流模块等逆变器控制硬件算法/控制单元,研究了它们的硬件算法,完成了模块化设计。分析了全数字锁相环的结构和模型,以此为基础,设计了一种应用于逆变器的,用比例积分方法替代传统锁相系统中的环路滤波,用相位累加器实现数控振荡器(DCO)功能的高精度二阶全数字锁相环(DPLL)。分析了“流水线操作”等设计优化问题,并针对逆变器控制系统中,控制系统算法呈多层结构,且层与层之间还有数据流联系,其执行顺序和数据流的走向较为复杂,不利于直接采用流水线技术进行设计的特点,提出一种全新的“分层多级流水线”设计技术,有效地解决了复杂控制系统的流水线优化设计问题。本文最后对芯片运行稳定性等问题进行了初步研究。指出了设计中的“竞争冒险”和饱受困扰之苦的“亚稳态”问题,分析了产生机理,并给出了常用的解决措施。
上传时间: 2013-05-28
上传用户:ice_qi
在机器人学的研究领域中,如何有效地提高机器人控制系统的控制性能始终是研究学者十分关注的一个重要内容。在分析了工业机器人的发展历程和机器人控制系统的研究现状后,本论文的主要目标是针对四关节实验室机器人特有的机械结构和数学模型,建立一个新型全数字的基于DSP和FPGA的机器人位置伺服控制系统的软、硬件平台,实现对四关节实验室机器人的精确控制。 本论文从实际情况出发,首先分析了所研究的四关节实验室机器人的本体结构,并对其抽象简化得到了它的运动学数学模型。在明确了实现机器人精确位置伺服控制的控制原理后,我们对机器人控制系统的诸多可行性方案进行了充分论证,并最终决定采用了三级CPU控制的控制体系结构:第一级CPU为上位计算机,它实现对机器人的系统管理、协调控制以及完成机器人实时轨迹规划等控制算法的运算;第二级CPU为高性能的DSP处理器,它辅之以具有高速并行处理能力的FPGA芯片,实现了对机器人多个关节的高速并行驱动;第三级CPU为交流伺服驱动处理器,它实现了机器人关节伺服电机的精确三闭环误差驱动控制,以及电机的故障诊断和自动保护等功能。此外,我们采用比普通UART速度快得多的USB来实现上位计算机.与下位控制器之间的数据通信,这样既保证了两者之间连接方便,又有效的提高了控制系统的通信速度和可靠性。 机器人系统的软件设计包括两个部分:一是采用VC++实现的上位监控软件系统,它主要负责机器人实时轨迹规划等控制算法的运算,同时完成用户与机器人系统之间的信息交互;二是采用C语言实现的下位DSP控制程序,它主要负责接收上位监控系统或者下位控制箱发送的控制信号,实现对机器人的实时驱动,同时还能够实时的向上位监控系统或者下位控制箱反馈机器人的当前状态信息。 研究开发出来的四关节实验室机器人控制器具有控制实时性好、定位精度高、运行稳定可靠的特点,它允许用户通过上位控制计算机实现对机器人的各种设定作业的控制,也可以让用户通过机器人控制箱现场对机器人进行回零、示教等各项操作。
上传时间: 2013-06-11
上传用户:edisonfather
网络带宽依然在不断增长(尤其是在本地网),最后一公里的高速接入日益普及;另一方面的情况是大容量的磁盘、FLASH移动存储盘和激光盘的容量不断增大,使得传送和储存数据的成本不断地下降。不仅使人发问:我们孜孜不倦的搞视频压缩高级算法还有多少意义?我们可以看到,算法的复杂性日益增加,但性能的提高却接近边缘。 是什么还在要求更高的压缩速率?还有被我们遗忘的地方吗?还有什么应用让我们继续追求更精妙的压缩算法? 在作者看来,这个应用领域就是移动视频服务。无线频谱这种稀缺资源的有限性决定了我们必须继续对视频压缩技术进行研究。即使伴随UMTS/IMT2000的到来,移动终端可以获得的数据速率也限制在144Kbit/s,在微蜂窝的时候最高能达到的速率上限也在2Mbit/s。144Kbit/s的速率对于较高质量的视频传输来讲,仍然是有限的。因此,可以预见,移动终端的空中接口这个瓶颈使得我们必须继续进行视频压缩。 另一方面,移动终端领域开发视频压缩算法,在其低功耗和实时性要求下,也是异常困难的。为了减少计算的复杂性和运动估计的功耗,业界提出了许多快速算法,例如2-D的对数搜索,三步搜索,联合搜索。尽管这些方法减少了功耗,其结果是视频压缩性能的降低,因为这些算法的本质是减少了运动搜索的空间。为了实现运动搜索的低功耗,在电路领域又提出了搜索窗口和时钟管理的措施。但这些方法都是在牺牲视频压缩比性能的基础进行的折中,并没有强调算法映射结构上做出处理。 本论文提出了一种新的解决MPEG-4运动估计运算的低功耗实时处理器架构。其基础是采用了心肌阵列并行处理技术和低功耗控制电路。运动估计的繁复运算通过心肌阵列分布式运算得到有效处理。从理论上看,心肌阵列有其简单易理解性,然后,由于FPGA的互联网络有限性,设计这样一个阵列仍有许多值得注意的问题。论文提出使用保守近似处理在全局运动估计中减少功耗,其本质是消除不必要的冗余运算。宏块的最小误差匹配是一个典型的串行操作过程。论文新提出的方法是在进行绝对匹配前使用保守计算,如果保守误差值与最小误差差别过大,则不进行绝对误差计算。 总的说来,论文实现了两个目标:通过心肌阵列实现了实时的运动估计编码,通过在算法层次引入控制电路,降低运动估计电路的功耗。
上传时间: 2013-06-23
上传用户:lacsx
本文结合工程需要详细论述了一种数字相位计的实现方法,该方法是基于FPGA(现场可编程门阵列)芯片运用FFT(快速傅立叶变换)算法完成的。首先,从相位测量的原理出发,分析了传统相位计的缺点,给出了一种高可靠性的相位检测实用算法,其算法核心是对采集信号进行FFT变换,通过频谱分析,实现对参考信号和测量信号初相位的检测,并同时阐述了FPGA在实现数字相位计核心FFT算法中的优势。在优化的硬件结构中,利用多个乘法器并行运算的方式加快了蝶形运算单元的运算速度;内置双端口RAM、旋转因子ROM使数据存储的速度得到提高;采用了流水线的工作方式使数据的存储、运算在时间上达到匹配。整个设计采用VHDL(超高速硬件描述语言)语言作为系统内部硬件结构的描述手段,在Altera的QuartusⅡ软件支持下完成。仿真结果表明,基于FPGA实现的FFT算法无论在速度和精度上都满足了相位测量的需要,其运算64点数据仅需27.5us,最大误差在1%之内。
上传时间: 2013-06-04
上传用户:lgnf
本论文依据IEEE802.16a物理层对RS-CC码的参数要求,研究了RS-CC码的高速编、译码的VLSI硬件算法,同时对FPGA开发技术进行了研究,以VerilogHDL为描述语言,在Xilinx公司的FPGA上实现了高速的RS-CC编、译码器。RS译码器中,错误位置多项式和错误值多项式的求解采用无求逆单元,并具有规则数据流、易于VLSI实现的改进的欧几里德算法(MEA);CC译码器由采用模归一化路径度量的全并行的“加比选(ACS)”模块和具有脉动阵列结构的幸存路径回溯模块组成。 在实现RS-CC译码器的过程中,分别从算法上和根据FPGA的结构特点上,对译码器做了一些优化工作,降低了硬件资源占有率和提高了译码速度。 此外,还搭建了以Xilinx公司40万等效门的FPGASpartan-Ⅲ400-4PQ208为主体,以Cypress公司的USB2.0芯片CY7C68013为高速数据接口的硬件试验平台,并在此试验平台上实现了文中的高速RS-CC编译码系统。
上传时间: 2013-06-03
上传用户:lx9076
随着现代雷达技术的不断发展,电子侦察设备面临电磁环境日益复杂多变,发展宽带化、数字化、多功能、软件化的电子侦察设备已是一项重要的任务.然而,目前的宽带A/D与后续DSP之间的工作速率总有一到两个数量级的差别,二者之间的瓶颈成为电子侦察系统数字化的最大障碍.通信领域软件无线电的成功应用为电子侦察系统的发展提供了一种理想模式.另一方面,微电子技术的快速发展,以及FPGA的广泛应用,在很大程度上影响了数字电路的设计与开发.这也为解决高速A/D与DSP处理能力之间的矛盾提供了一种有效的解决方法.为了解决宽带A/D与后续DSP之间的瓶颈问题,本文给出了一种基于多相滤波的宽带数字下变频结构,并从软件无线电原理出发,从理论推导和计算机仿真两方面对该结构进行了验证,并进一步给出该结构改进方案以及改进的多相滤波数字下变频结构的硬件实现方法.本文将多相滤波下变频的并行结构应用到数字下变频电路中,并在后继的混频模块中也采用并行混频的方式来实现,不仅在一定程度上解决了二者之间的瓶颈问题,同时也大大提高了实时处理速度.经过多相滤波下变频处理后的数据,在速率和数据量上都有大幅减少,达到了现有通用DSP器件处理能力的要求.另外,本人还用FPGA设计了实验电路,利用微机串口,与实验目标板进行控制和数据交换.利用FPGA的在线编程特性,可以方便灵活的对各种实现方法加以验证和比较.
上传时间: 2013-07-13
上传用户:华华123