首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
在分子动力学模拟系统中,实现分子间短程力的计算需要频繁地传输与大量的粒子数据访问。为了减轻CPU的计算负载,可以使用FPGA加速计算。但是,在基于FPGA的分子动力学模拟系统中,短程力计算模块面临巨大的数据传输压力以及访存冲突问题。针对这些问题,基于FPGA上有限的硬件资源,提出一种交互控制系统。该系统由取数控制模块与粒子数据解析模块组成。整个系统通过合理的数据编排以及2个模块的协同工作,实现粒子数据从片上存储到短程力计算模块的快速可靠的传输。通过硬件仿真和板级实验验证了该系统在处理粒子数据过程中的有效性和可靠性。  相似文献   

2.
为了实现图像的实时处理,常采用现场可编程门阵列FPGA对采集到的图像数据进行预处理。以对Micron MT9V112传感器的Bayer图像数据处理为例,首先就Bayer数据坏点修正、Bayer转RGB888及RGB888降噪进行了介绍,然后应用Verilog HDL语言设计出相应的硬件模块,最后结合MATLAB对硬件模块处理后的数据做了相应的测试。仿真结果表明,硬件模块对640x480数据的处理满足系统实时性要求。  相似文献   

3.
介绍了一种基于PCI总线和多片并行FPGA的高速计算平台。FPGA+PCI板卡利用普通PC机作为CPU,通过PCI总线互联,实现了一个并行高速的通用数字运算平台。利用VHDL语言编写各种算法,可用于加解密算法实现和高速数字信号处理等领域,而速度相当于数台PC机并行运算。  相似文献   

4.
为提升在资源、功耗受限的嵌入式平台上运行的深度卷积网络算法的速度和能效,提出一种基于现场可编程门阵列(FPGA)的卷积并行加速方案。利用卷积层与批归一化(batch normalization,BN)层融合减少计算复杂度;利用数据分片减少片上存储消耗;利用数据复用、并行计算提升运算速度,减少系统硬件开销;利用设计空间探索找到最符合硬件资源约束的计算并行度。实验结果表明,在100MHz的工作频率下,加速器的峰值计算性能可以达到52.56GFLOPS,性能是CPU的4.1倍,能耗仅为GPU的9.9%,与其它FPGA方案相比综合性能有一定的提升。  相似文献   

5.
为提高分子动力学模拟中短程力的计算效率,设计并实现了基于FPGA的分子动力学模拟短程力多流水计算系统。针对在短程力多流水计算过程中多个计算模块频繁调用大量的粒子信息导致的高带宽需求和访问内存冲突问题,提出了多流水数据预取系统的设计,可减少对粒子数据的重复读取,缓解访问冲突,保证计算模块的效率。本文使用Xilinx Virtex UltraScale+HBM VCU128 FPGA开发板,实验结果表明,与短程力单流水计算系统相比,短程力多流水计算系统的计算效率提高了3.29倍,同时验证了多流水数据预取系统的有效性。  相似文献   

6.
结合FPGA设计的特点,提出一种可灵活配置的多模式FPGA逻辑单元结构及对其进行工艺映射的工具VMAP.该工具中除了采用一般的工艺映射算法外,还结合逻辑单元结构特点提出了专门的合并优化算法.该算法基于图的最大基数匹配,将部分查找表进行合并,减小了映射结果的面积开销.实验结果表明.对于标准的测试电路,结合文中的逻辑单元结构和合并算法得到的工艺映射结果平均可以减少15.7%的基本逻辑单元使用个数.  相似文献   

7.
Systolic乘法是一种基于SIMD-MC2模型的矩阵乘算法,无法直接应用在单独的嵌入式系统中,所以提出一种采用FPGA技术实现Systolic乘法的方法。该方法将FPGA的硬件并行特性与巧妙的并行算法结合起来,利用FPGA灵活可编程的特点,在FPGA内部设计了一种基于MC2模型的节点阵列来实现Systolic乘法。实际应用中,可以灵活地修改节点单元的数量和节点的功能来满足不同规模的运算矩阵需求并充分利用FPGA的资源。仿真结果验证了该方法的正确性。实际测试结果表明:该方法具有较快的速度和较高的实时性。  相似文献   

8.
本文提出了一种使用FPGA实现误码率测试的设计及实现方法。该设计可通过FPGA内建的异步串行接口向主控计算机传递误码信息。也可以通过数码管实时显示一段时间内的误码率。文章先介绍了系统构成和工作流程,然后重点分析了关键技术的实现。  相似文献   

9.
基于FPGA的数字化水表设计   总被引:1,自引:0,他引:1  
文章在MAX PLUS Ⅱ开发环境下采用VHDL语言,设计并实现了数字化水表,讨论了系统的三个组成模块的设计和VHDL实现.整体的生成采用图形输入法.波形仿真及下载芯片测试表明该设计方案是可行的.该设计首次实现了用水水费的分段计费及数字化显示.  相似文献   

10.
提出了一种基于FPGA的CCD相机采样率控制系统,该系统能改善线阵CCD相机采样的均匀性,使成像质量得到提高。  相似文献   

11.
分子动力学并行算法研究   总被引:6,自引:1,他引:5  
文章阐述了三种用于分子动力学计算的并行算法,并分别就算法的计算量、通信量和负载均衡进行了分析。  相似文献   

12.
基于分子动力学模拟的改进混合蛙跳算法   总被引:1,自引:0,他引:1  
针对基本的混合蛙跳算法(Shuffled frog leaping algorithm,SFLA)后期搜索速度变慢,容易陷入局部最优解的缺点,借鉴分子动力学(Molecular dynamics,MD)模拟的思想,提出一种基于分子动力学模拟的改进的混合蛙跳算法。该算法将种群中的粒子等效成分子,并提出一种新的分子间作用力计算方法来代替两体间经典的Lennard-Jones作用力计算方法,利用Velocity-Verlet算法和高斯变异算子代替基本混合蛙跳算法的更新策略,有效地平衡了种群的多样性和搜索的高效性。高维多峰函数测试的结果表明,基于分子动力学模拟的改进混合蛙跳算法能提高算法后期跳出局部极值的能力,全局寻优能力明显优于基本的混合蛙跳算法。  相似文献   

13.
The IBM Blue Gene/C parallel computer aims to demonstrate the feasibility of a cellular architecture computer with millions of concurrent threads of execution. One of the major challenges in this project is showing that applications can successfully scale to this massive amount of parallelism. In this paper we demonstrate that the simulation of protein folding using classical molecular dynamics falls in this category. Starting from the sequential version of a well known molecular dynamics code, we developed a new parallel implementation that exploited the multiple levels of parallelism present in the Blue Gene/C cellular architecture. We performed both analytical and simulation studies of the behavior of this application when executed on a very large number of threads. As a result, we demonstrate that this class of applications can execute efficiently on a large cellular machine.  相似文献   

14.
AES在安全性、高性能、高效率、易用性和灵活性等方面都具有显著的优点,随着业界对计算性能要求的不断提高,在FPGA上实现AES加解密硬核的研究得到了越来越多的关注。在深入分析AES算法的基础上,提出了基于FPGA的AES全流水硬件核设计模型。模型中改进了ae数据块和轮运算的硬件设计结构,有效地提高了AES硬核的计算性能。在Altera公司EP4CE40F23C6FPGA上的硬件实现结果显示,该AES硬核的硬件资源消耗为6413个LE和80个M9K,工作频率为310MHz,计算吞吐率为9.92Gbps,获得了非常好的计算加速效果。  相似文献   

15.
黄兆伟  王连明 《计算机应用研究》2020,37(9):2762-2765,2771
针对目前采用IEEE 754浮点标准设计的FPGA浮点运算器中吞吐率与资源利用率低等问题,提出一种运算精度与运算器数量可配置的并行浮点向量乘法运算单元。通过浮点运算器的指数、尾数位数可配置化设计,提高系统资源利用率,并将流水线技术与并行结构结合,提高数据吞吐率。以EP4CE115型FPGA为测试平台,当配置10组FP14运算器时,系统的逻辑资源占用约为4.2%,峰值吞吐率可达4.5 GFLOPS。结果表明,提出的浮点向量乘法单元有效提高了FPGA资源利用率与运算吞吐率,同时具有高度的可移植性与通用性,适用于FPGA向量乘法运算的加速。  相似文献   

16.
计算机辅助药物分子对接并行演化设计   总被引:1,自引:0,他引:1  
对分子对接理论作了简单介绍,建立了一个基于柔性配体分子与刚性受体分子对接的数学规划模型,将分子对接中的构象优化搜索转化为求解约束极小化问题的过程,并采用带有空间收缩的多种群并行遗传算法进行求解.在分布式存储的并行机曙光3000上模拟计算表明,该设计具有很高的并行加速比,在保证分子对接的准确性和有效性的前提下,大大提高了分子构象搜索的速度.  相似文献   

17.
文章针对三维分子动力学并行数值模拟中出现的负载不平衡现象,在静态负载平衡基础上,提出了一种简单有效的动态负载平衡算法。通过对三维分子动力学的并行数值模拟试验,此算法可以使得负载基本达到动态平衡,并进一步提高了并行效率。  相似文献   

18.
Xilinx XC6200系列FPGA的编程方法   总被引:2,自引:0,他引:2  
美国Xilinx公司的XC6200系列FPGA是一种细粒度结构的可重构处理器,由于接口设计简单和动态重构特性好,使其在数字系统中得到广泛应用。本文先简要介绍其结构特点,然后详细说明硬件编程方法和基于XC6000开发系统的软件设计过程及其实例。  相似文献   

19.
徐苛杰  何鹏举  张冰 《传感技术学报》2006,19(6):2536-2539,2543
为了适应战术技术需要,微惯性测量装置要求具有体积小、重量轻、速度快、实时性能高等特性,目前还没有较好的方法来实现.本文提出了一种基于FPGA的硬件体系结构,在FPGA片内使用硬件描述语言编程构建了微惯性测量组合的信号采集、处理与输出电路平台,在应用中取得了较好的效果.该电路设计具有较强的通用性,在选用不同敏感元件时可通过在线编程迅速重构FPGA片内系统,形成新的微惯性测量组合.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号