可编程逻辑芯片特别是现场可编程门阵列(Field-Programmable Gate Array,FPGA)芯片的快速发展,使得新的芯片能够根据具体应用动态地调整结构以获得更好的性能,这类芯片称为动态可重构FPGA芯片(Dynamically ReconfigurableFPGA,DRFPGA)。然而,使用这类芯片构建的可重构系统在实际应用前还有许多问题需要解决。一个基本的问题就是动态可重构FPGA芯片中的可重构功能单元(Reconfigurable Functional Unit,RFU)的模块布局问题和模块间的布线问题。 本文从基本的FPGA芯片结构和CAD算法谈起,介绍了可重构计算的概念,建立了可重构计算系统模型和动态可重构FPGA芯片模型,在此模型上提出一个基于划分和时延驱动的在线布局算法,和一个基于Pathfinder协商拥塞算法的布线算法,来解决动态可重构FPGA芯片的布局和布线问题。由硬件描述语言(Hardware Description Language,HDL)描述的电路首先被划分成有限数目的层,然后将这些电路层布局到芯片的每一层,同时确保关键路径的时延最小。实验结果表明,布局算法与传统的布局算法(或者文献[37]中的算法)相比,在时延上平均减少27%,在线长上平均减少34%(或者11%),在运行时间上平均减少42%(或者97%)。布线算法与传统的布线算法相比,能够将线长降低26%,将水平通道宽度降低27%,显示出较高的性能。
上传时间: 2013-05-24
上传用户:Neoemily
随着现代互联网规模的不断扩大,网络数据流量迅速增长,传统的路由器已经无法满足网络的交换和路由需求。当前,新一代路由器普遍利用了交换式路由技术,通过使用交换背板以充分利用公共通信链路,有效的提高了链路的利用率,并使各通信节点的并行通信成为可能。硬件系统设计中结合了专用网络处理器,可编程器件各自的特点,采用了基于ASIC,FPGA,CPLD硬件结构模块化的设计方法。基于ASIC技术体系的GSR的出现,使得路由器的性能大大提高。但是,这种路由器主要满足数据业务(文字,图象)的传送要求,不能解决全业务(语音,数据,视频)数据传送的需要。随着网络规模的扩大,矛盾越来越突出,而基于网络处理器技术的新一代路由器,从理论上提出了解决GSR所存在问题的解决方案。 基于网络路由器技术实现的路由器,采用交换FPGA芯片硬件实现的方式,对路由器内部各种单播、多播数据包进行路由转发,实现网络路由器与外部数据收发芯片的数据通信。本文主要针对路由器内部交换FPGA芯片数据转发流程的特点,分析研究了传统交换FPGA所采用的交换算法,针对简单FIFO算法所产生的线头阻塞现象,结合虚拟输出队列(VOQ)机制及队列仲裁算法(RRM)的特点,并根据实际设计中各外围接口芯片,给出了一种消除数据转发过程中出现的线头阻塞的iSLIP改进算法。针对实际网络单播、多播数据包在数据转发处理过程的不同,给出了实际的解决方案。并对FPGA外部SSRAM包缓存带宽的利用,数据转发的包乱序现象及FPGA内部环回数据包的处理流程作了分析并提出了解决方案,有效的提高了路由器数据交换性能。 根据设计方案所采用的算法的实现方式,结合FPGA内部部分关键模块的功能特点及性能要求,给出了交换FPGA内部可用BlockRam资源合理的分配方案及部分模块的设计实现,满足了实际的设计要求。所有处理模块均在xilinx公司的FPGA芯片中实现。
上传时间: 2013-04-24
上传用户:牛布牛
近年来,计算机图形学应用越来越广泛,尤其是三维(3D)绘图。3D绘图使用3D模型和各种影像处理产生具有三维空间真实感的影像,应用于虚拟真实情况以及多媒体的产品上,且多半是使用低成本的实时3D计算机绘图技术为基础。在初期3D图形学刚起步时,由于图形简单,因此可以利用CPU来运算,但随着图形学技术的发展,所要绘制的图形越来越复杂,这时如果单纯依赖CPU来处理,不能达到实时的要求,因此需要专门的硬件来加速图形处理,GPU(图形处理单元)因此出现了。不过由于3D图形加速硬件的复杂性和短寿命,这极大地提高了对硬件开发环境的需要。为了更好的对设计进行更改和测试,不能仅仅用专门定制的方法来设计,需要其他的方:硬件描述语言(HDL)和FPGA。 随着计算机绘图规模的需要,借助辅助硬件资源,来提高图形处理单元(GPU)处理速度的需求越来越普遍。自从15年前现场可编程门阵列(FPGA)开始出现以来,其在可编程硬件领域所起的作用越来越大。它们在速度、体积和速度方面都有了很大的提高。这意味着FPGA在以前只能使用专用硬件的场合越来越重要。其中一个应用领域就是3D图形渲染,在这个研究领域里人们正在利用具有可编程性能的FPGA来帮助改进图形处理单元(GPU)的性能。 能够在廉价、可动态重新配置的FPGA上实现复杂算法来辅助硬件设计。本文的设计就是通过在FPGA上实现3维图形几何处理管线部分功能来提高图形处理速度。具体实现中使用硬件描述语言(Verilog HDL)进行逻辑设计,并发现问题解决问题。 本文主要特色如下: 1.针对几何变换换子系统,提出一种硬件实现方案,该方案能对基本的几何变换如:平移、缩放、旋转和投影进行操作。首先构造出总体变换矩阵,随后进行矩阵乘法运算,再进行投影变换,最后输出变换座标。提出一种脉动阵列结构,用于两个矩阵的乘法运算。找到一种快捷的方法来实现矩阵相乘,将能大大提高系统的效率。 2.对于3D图形裁剪,文中描述了一种裁剪引擎,它能够处理3D图形中的裁剪、透视除法以及视口映射的功能。硬件实现的难度取决于裁剪算法的复杂程度。我们在Sutherland-Hodgman裁剪算法的基础上提出一种新的裁剪算法,该算法通过去除冗余顶点以提高处理速度,同时利用编码来判断线段可见性的方法使得硬件实现变得很容易。 3.最后,我们在FPGA上实现了几何变换以及三维裁剪,并与C语言的模拟结果对比发现结果正确,且三维裁剪能够以3M个三角形/s的速度运行,满足了图形流水中的实时性要求。
上传时间: 2013-04-24
上传用户:yerik
采用现场可编程门阵列(FPGA)可以快速实现数字电路,但是用于生成FPGA编程的比特流文件的CAD工具在编制大规模电路时常常需要数小时的时间,以至于许多设计者甚至通过在给定FPGA上采用更多的资源,或者以牺牲电路速度为代价来提高编制速度。电路编制过程中大部分时间花费在布线阶段,因此有效的布线算法能极大地减少布线时间。 许多布线算法已经被开发并获得应用,其中布尔可满足性(SAT)布线算法及几何查找布线算法是当前最为流行的两种。然而它们各有缺点:基于SAT的布线算法在可扩展性上有很大缺陷;几何查找布线算法虽然具有广泛的拆线重布线能力,但当实际问题具有严格的布线约束条件时,它在布线方案的收敛方面存在很大困难。基于此,本文致力于探索一种能有效解决以上问题的新型算法,具体研究工作和结果可归纳如下。 1、在全面调查FPGA结构的最新研究动态的基础上,确定了一种FPGA布线结构模型,即一个基于SRAM的对称阵列(岛状)FPGA结构作为研究对象,该模型仅需3个适合的参数即能表示布线结构。为使所有布线算法可在相同平台上运行,选择了美国北卡罗来纳州微电子中心的20个大规模电路作为基准,并在布线前采用VPR399对每个电路都生成30个布局,从而使所有的布线算法都能够直接在这些预制电路上运行。 2、详细研究了四种几何查找布线算法,即一种基本迷宫布线算法Lee,一种基于协商的性能驱动的布线算法PathFinder,一种快速的时延驱动的布线算法VPR430和一种协商A
上传时间: 2013-05-18
上传用户:ukuk
纹理映射在计算机图形计算中属于光栅化阶段,处理的是像素,主要的特点是数据的吞吐量大,对实时系统来说转换的速度是一个关键的因素,人们寻求各种加速算法来提高运算速度。传统的方法是用更快的处理器,并行算法或专用硬件。随着数字技术的发展,尤其是可编程逻辑门阵列(FPGAs)的发展,提供了一种新的加速方法。FPGAs在密度和性能上都有突破性的发展,当前的FPGA芯片已经能够运算各种图形算法,而在速度上与专用的图形卡硬件相同。因此,FPGA芯片非常适合这项工作。 本文主要工作包括以下几个方面: 1、本文提出了一种MIPmapping纹理映射优化方法,改进了MIPmapping映射细化层次算法及纹理图像的存储方式,减少纹理寻址的计算量,提高纹理存储的相关性。详细内容请阅读第三章。 2、提出了一种MIPmapping纹理映射优化方法的硬件实现方案,该方案针对移动设备对功耗和面积的要求,以及分辨率不高的特点,在参数空间到纹理地址的计算中用定点数来实现。详细内容请阅读第四章。 3、实现了纹理映射流水线单元纹理地址产生电路,及纹理滤波电路的FPGA设计,并给出设计的综合和仿真结果。详细内容请阅读第五章4、实现了符合IEEE 754单精度标准的乘法、乘累加及除法运算器电路。乘法器采用改进型Booth编码电路以减少部分积数量,用Wallace对部分积进行压缩;乘累加器采用multiply-add fused算法,对关键路径进行了优化;除法器为基于改进型泰勒级数展开的查找表结构实现,查找表尺寸只有208字节,电路为固定时延,在电路尺寸、延时及复杂度方面进行了较好的平衡。
上传时间: 2013-04-24
上传用户:yxvideo
FPGA布局算法和软件位于工艺映射和布线之间,是一个承上启下的阶段,对最终的布通率和时序都有着重要的影响。 本论文的工作之一便是研究旨在提高布通率的布局算法。在研究了国内外装箱和布局算法的基础上,本文提出了一种新的结合了装箱的布局算法框架,并称之为"低温交替改善的"布局算法。其基本思想是,在模拟退火的低温阶段交替的优化装箱和布局。本文给了基于学术界标准布局布线软件VPR的一个软件实现,并且提出了低温的判定条件以及一种新的选择待交换逻辑单元的方法。采用三种不同的装箱算法作为布局输入,基于VPR的低温交替改善的布局算法实现,在布通率上,比VPR分别提高了21.3%、15.5%、10.7%。而带来的平均额外时间开销不到20%。 FPGA布局软件实现对整个FPGA CAD流程的运行效率,算法的可扩展性也有着不可忽视的影响。现代FPGA有着多样而复杂的逻辑和布线资源。而学术界的布局软件'VPR所面向的FPGA却只能处理十分简单的FPGA结构,对于宏、总线、多时钟等实际应用中很重要的部分都没有考虑。本文提出了"逻辑单元层"的概念,用具有特定几何结构的逻辑单元层来统一处理多种类型的逻辑资源。针对相对位置约束在现代FPGA布局软件中的重要地位,我们提出了一种处理相对位置约束的方法。这些讨论均已经在面向Xilinx SpartanⅡ芯片布局的原型系统中得到了实现,初步证实了这些方法的可扩展性和实用性。
上传时间: 2013-06-21
上传用户:ezgame
CCSDS组织(空间数据系统咨询委员会)于2005年公布了新的图像压缩标准,该标准算法采用基于小波变换的比特平面编码方法,支持无损有损压缩编码和精确码率控制并具有较好的抗误码能力和非常高的图像压缩性能,能满足实际应用中的多种需求。同时该算法具有较低的算法复杂度,易于低功耗硬件实现,并且对航天图像具有较高的适应性,因此,在航天应用方面具有广阔的前景。 本论文主要针对CCSDS图像压缩算法的FPGA硬件实现,在有限的硬件资源下,提出高速高效的CCSDS图像压缩编码器设计方案并在已有的FPGA硬件平台上加以实现。本文首先对CCSDS图像压缩算法的编码原理进行详细介绍;然后提出DWT、BPE和码流组织这三大模块的并行化硬件实现方案,并给出了进行批量仿真测试的仿真平台设计方案。最后在Xilinx VIRTEX-II FPGA平台上经过成功验证,测试结果表明系统各项技术指标可满足星载图像压缩的要求。
上传时间: 2013-06-13
上传用户:wanghui2438
·【内容简介】本书所关注的是图算法领域。从实用的视角,以独特的结构将有关内容组织在一起,从而使读者不仅可以对这一领域有系统性的认识,而且还可在实践中灵活使用所提供的算法工具。本版中,增加了数以千计的新练习、数百年新图表以及数十个新程序,而且对所有的图表和程序都做了详尽的注释说明;不仅涵盖了新的主题,还对许多经典算法提供了更为充分的解释。所有读者都可从中得到极为丰富的学习资料,从而更好地理解基本概念。
上传时间: 2013-04-24
上传用户:pscsmon
介绍了基于数字图像处理的QR码识别算法。该方案综合运用了图像灰度化、滤波去噪、二值化、边缘检测、图像旋转等多种图像处理方法对条码图像进行预处理。理论分析和实验结果表明:该算法提高了识读的灵活性和可靠性,为QR码识别提供了一种新途径。
上传时间: 2013-11-13
上传用户:cccole0605
为了提高数字水印抗击各种图像攻击的性能和保持图像的稳健性和不可见性,提出了一种基于离散小波变换(DWT),SVD(singular value decomposition)奇异值分解水印图像和原始载体图像的离散余弦变换(DCT)的自适应水印嵌入算法,主要是将水印图像的两次小波变换后的低频分量潜入到原始图像分块经过SVD分解的S分量矩阵中,同时根据图像的JPEG压缩比的不同计算各个图像块的水印调节因子。实验证明该算法在抗击JPEG压缩、中值滤波、加噪等均具有很好的鲁棒性,嵌入后的图像的PSNR达到38,具有良好的视觉掩蔽性
标签: 数字水印算法
上传时间: 2013-10-09
上传用户:ca05991270