共查询到19条相似文献,搜索用时 78 毫秒
1.
在分子动力学模拟系统中,实现分子间短程力的计算需要频繁地传输与大量的粒子数据访问。为了减轻CPU的计算负载,可以使用FPGA加速计算。但是,在基于FPGA的分子动力学模拟系统中,短程力计算模块面临巨大的数据传输压力以及访存冲突问题。针对这些问题,基于FPGA上有限的硬件资源,提出一种交互控制系统。该系统由取数控制模块与粒子数据解析模块组成。整个系统通过合理的数据编排以及2个模块的协同工作,实现粒子数据从片上存储到短程力计算模块的快速可靠的传输。通过硬件仿真和板级实验验证了该系统在处理粒子数据过程中的有效性和可靠性。 相似文献
2.
3.
4.
为提升在资源、功耗受限的嵌入式平台上运行的深度卷积网络算法的速度和能效,提出一种基于现场可编程门阵列(FPGA)的卷积并行加速方案。利用卷积层与批归一化(batch normalization,BN)层融合减少计算复杂度;利用数据分片减少片上存储消耗;利用数据复用、并行计算提升运算速度,减少系统硬件开销;利用设计空间探索找到最符合硬件资源约束的计算并行度。实验结果表明,在100MHz的工作频率下,加速器的峰值计算性能可以达到52.56GFLOPS,性能是CPU的4.1倍,能耗仅为GPU的9.9%,与其它FPGA方案相比综合性能有一定的提升。 相似文献
5.
为提高分子动力学模拟中短程力的计算效率,设计并实现了基于FPGA的分子动力学模拟短程力多流水计算系统。针对在短程力多流水计算过程中多个计算模块频繁调用大量的粒子信息导致的高带宽需求和访问内存冲突问题,提出了多流水数据预取系统的设计,可减少对粒子数据的重复读取,缓解访问冲突,保证计算模块的效率。本文使用Xilinx Virtex UltraScale+HBM VCU128 FPGA开发板,实验结果表明,与短程力单流水计算系统相比,短程力多流水计算系统的计算效率提高了3.29倍,同时验证了多流水数据预取系统的有效性。 相似文献
6.
结合FPGA设计的特点,提出一种可灵活配置的多模式FPGA逻辑单元结构及对其进行工艺映射的工具VMAP.该工具中除了采用一般的工艺映射算法外,还结合逻辑单元结构特点提出了专门的合并优化算法.该算法基于图的最大基数匹配,将部分查找表进行合并,减小了映射结果的面积开销.实验结果表明.对于标准的测试电路,结合文中的逻辑单元结构和合并算法得到的工艺映射结果平均可以减少15.7%的基本逻辑单元使用个数. 相似文献
7.
Systolic乘法是一种基于SIMD-MC2模型的矩阵乘算法,无法直接应用在单独的嵌入式系统中,所以提出一种采用FPGA技术实现Systolic乘法的方法。该方法将FPGA的硬件并行特性与巧妙的并行算法结合起来,利用FPGA灵活可编程的特点,在FPGA内部设计了一种基于MC2模型的节点阵列来实现Systolic乘法。实际应用中,可以灵活地修改节点单元的数量和节点的功能来满足不同规模的运算矩阵需求并充分利用FPGA的资源。仿真结果验证了该方法的正确性。实际测试结果表明:该方法具有较快的速度和较高的实时性。 相似文献
8.
9.
基于FPGA的数字化水表设计 总被引:1,自引:0,他引:1
文章在MAX PLUS Ⅱ开发环境下采用VHDL语言,设计并实现了数字化水表,讨论了系统的三个组成模块的设计和VHDL实现.整体的生成采用图形输入法.波形仿真及下载芯片测试表明该设计方案是可行的.该设计首次实现了用水水费的分段计费及数字化显示. 相似文献
10.
提出了一种基于FPGA的CCD相机采样率控制系统,该系统能改善线阵CCD相机采样的均匀性,使成像质量得到提高。 相似文献
11.
12.
基于分子动力学模拟的改进混合蛙跳算法 总被引:1,自引:0,他引:1
针对基本的混合蛙跳算法(Shuffled frog leaping algorithm,SFLA)后期搜索速度变慢,容易陷入局部最优解的缺点,借鉴分子动力学(Molecular dynamics,MD)模拟的思想,提出一种基于分子动力学模拟的改进的混合蛙跳算法。该算法将种群中的粒子等效成分子,并提出一种新的分子间作用力计算方法来代替两体间经典的Lennard-Jones作用力计算方法,利用Velocity-Verlet算法和高斯变异算子代替基本混合蛙跳算法的更新策略,有效地平衡了种群的多样性和搜索的高效性。高维多峰函数测试的结果表明,基于分子动力学模拟的改进混合蛙跳算法能提高算法后期跳出局部极值的能力,全局寻优能力明显优于基本的混合蛙跳算法。 相似文献
13.
Demonstrating the Scalability of a Molecular Dynamics Application on a Petaflops Computer 总被引:1,自引:0,他引:1
Almasi George S. Caşcaval Călin Castaños José G. Denneau Monty Donath Wilm Eleftheriou Maria Giampapa Mark Ho Howard Lieber Derek Moreira José E. Newns Dennis Snir Marc Warren Henry S. 《International journal of parallel programming》2002,30(4):317-351
The IBM Blue Gene/C parallel computer aims to demonstrate the feasibility of a cellular architecture computer with millions of concurrent threads of execution. One of the major challenges in this project is showing that applications can successfully scale to this massive amount of parallelism. In this paper we demonstrate that the simulation of protein folding using classical molecular dynamics falls in this category. Starting from the sequential version of a well known molecular dynamics code, we developed a new parallel implementation that exploited the multiple levels of parallelism present in the Blue Gene/C cellular architecture. We performed both analytical and simulation studies of the behavior of this application when executed on a very large number of threads. As a result, we demonstrate that this class of applications can execute efficiently on a large cellular machine. 相似文献
14.
AES在安全性、高性能、高效率、易用性和灵活性等方面都具有显著的优点,随着业界对计算性能要求的不断提高,在FPGA上实现AES加解密硬核的研究得到了越来越多的关注。在深入分析AES算法的基础上,提出了基于FPGA的AES全流水硬件核设计模型。模型中改进了ae数据块和轮运算的硬件设计结构,有效地提高了AES硬核的计算性能。在Altera公司EP4CE40F23C6FPGA上的硬件实现结果显示,该AES硬核的硬件资源消耗为6413个LE和80个M9K,工作频率为310MHz,计算吞吐率为9.92Gbps,获得了非常好的计算加速效果。 相似文献
15.
针对目前采用IEEE 754浮点标准设计的FPGA浮点运算器中吞吐率与资源利用率低等问题,提出一种运算精度与运算器数量可配置的并行浮点向量乘法运算单元。通过浮点运算器的指数、尾数位数可配置化设计,提高系统资源利用率,并将流水线技术与并行结构结合,提高数据吞吐率。以EP4CE115型FPGA为测试平台,当配置10组FP14运算器时,系统的逻辑资源占用约为4.2%,峰值吞吐率可达4.5 GFLOPS。结果表明,提出的浮点向量乘法单元有效提高了FPGA资源利用率与运算吞吐率,同时具有高度的可移植性与通用性,适用于FPGA向量乘法运算的加速。 相似文献
16.
计算机辅助药物分子对接并行演化设计 总被引:1,自引:0,他引:1
对分子对接理论作了简单介绍,建立了一个基于柔性配体分子与刚性受体分子对接的数学规划模型,将分子对接中的构象优化搜索转化为求解约束极小化问题的过程,并采用带有空间收缩的多种群并行遗传算法进行求解.在分布式存储的并行机曙光3000上模拟计算表明,该设计具有很高的并行加速比,在保证分子对接的准确性和有效性的前提下,大大提高了分子构象搜索的速度. 相似文献
17.
文章针对三维分子动力学并行数值模拟中出现的负载不平衡现象,在静态负载平衡基础上,提出了一种简单有效的动态负载平衡算法。通过对三维分子动力学的并行数值模拟试验,此算法可以使得负载基本达到动态平衡,并进一步提高了并行效率。 相似文献
18.
Xilinx XC6200系列FPGA的编程方法 总被引:2,自引:0,他引:2
美国Xilinx公司的XC6200系列FPGA是一种细粒度结构的可重构处理器,由于接口设计简单和动态重构特性好,使其在数字系统中得到广泛应用。本文先简要介绍其结构特点,然后详细说明硬件编程方法和基于XC6000开发系统的软件设计过程及其实例。 相似文献