基于Message-Passing Interface ( MPI)的编程环境,以PML (Perfectly Matched Layer)为吸收边界条件,讨论了时域有限差分法FDTD的三维并行运算情况。通过一定的数值计算,定量地给出了MPI下FDTD并行算法中的网格数、进程数、分割方式三者之间的关系以及对计算效率的影响。
上传时间: 2013-11-05
上传用户:啊飒飒大师的
计算并行运算的代码,用mpI实现并行运算,
上传时间: 2015-10-26
上传用户:waizhang
Intel Threading Building Blocks多核并行运算库的源码。TBB是Intel开发的多核运算库,用并行处理算法循环,并附带了一个版本的hash map
标签: Intel Threading Building Blocks
上传时间: 2013-11-30
上传用户:yoleeson
可分离据卷积,在GPU上实现并行运算,比较CPU和GPU上的效率比较
上传时间: 2016-07-12
上传用户:lo25643
可分离据卷积,在GPU上实现并行运算,比较CPU和GPU上的效率比较
上传时间: 2013-12-29
上传用户:xinzhch
时域有限差分的并行运算,matlab编程.主要是并行运算的连接问题的程序
上传时间: 2016-11-26
上传用户:tianjinfan
Win32 多线程设计手册的源码;对完成并行运算有很大的帮助
上传时间: 2016-12-12
上传用户:xfbs821
Matlab 自2008版本后可以进行并行运算,充分利用CPU资源,这里给出具体进行多核心运算的设置和并行计算工具箱说明
上传时间: 2013-12-19
上传用户:diets
密集型的矩阵运算在信号处理和图像处理中被广泛应用,而且往往需要系统进行实时运算,这就需要系统具有很高的吞吐率。因此寻找矩阵运算的高速实现方法是很有意义的。FPGA的运算速度快并且可以并行运算,和其它矩阵运算的实现方式相比,FPGA有其独特的优势。本文主要设计并实现了基于FPGA的各种矩阵运算模块。 本文首先介绍了矩阵运算的特点和原理,接着讨论了FPGA浮点运算单元的VHDL设计方法,在此基础上,设计了矩阵相乘累加、三角矩阵求逆和一般矩阵分解求逆的运算模块,给出矩阵阶数扩大时各种矩阵运算的分块实现方法。然后在ModelSim环境下仿真了一般矩阵的求逆模块,与Maflab仿真结果比较,分析了运算精度、时间复杂度和资源占用情况,在Virtex-4系列FPGA硬件平台上进行了调试和测试,并通过USB接口将矩阵运算结果送入PC机,验证了基于FPGA矩阵运算的正确性和可行性。最后对矩阵求逆模块在雷达信号中的应用作了简单介绍。
上传时间: 2013-06-08
上传用户:小枫残月
密集型的矩阵运算在信号处理和图像处理中被广泛应用,而且往往需要系统进行实时运算,这就需要系统具有很高的吞吐率。因此寻找矩阵运算的高速实现方法是很有意义的。FPGA的运算速度快并且可以并行运算,和其它矩阵运算的实现方式相比,FPGA有其独特的优势。本文主要设计并实现了基于FPGA的各种矩阵运算模块。 本文首先介绍了矩阵运算的特点和原理,接着讨论了FPGA浮点运算单元的VHDL设计方法,在此基础上,设计了矩阵相乘累加、三角矩阵求逆和一般矩阵分解求逆的运算模块,给出矩阵阶数扩大时各种矩阵运算的分块实现方法。然后在ModelSim环境下仿真了一般矩阵的求逆模块,与Maflab仿真结果比较,分析了运算精度、时间复杂度和资源占用情况,在Virtex-4系列FPGA硬件平台上进行了调试和测试,并通过USB接口将矩阵运算结果送入PC机,验证了基于FPGA矩阵运算的正确性和可行性。最后对矩阵求逆模块在雷达信号中的应用作了简单介绍。
上传时间: 2013-07-20
上传用户:561596