首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
多细胞分子动力学算法是分子动力学模拟中普遍使用的并行算法.因为利用不同作用路径的多细胞分子动力学算法的消息传递次数彼此不同,利用作用路径能够优化消息传递次数.优化消息传递次数是一种设计高效并行算法的方法.因此,本文研究十六个不同的作用路径,推导出十六个表示消息传递次数的数学模型,并在高性能通信和负载平衡方面决定十六个模型中最好的.实验结果表明模型的平均正确率是99.1391%,它的一个时间步骤的并行效率比HS算法平均提高了5.16%,处理器数的增加和截断半径的优化提高其并行效率.  相似文献   

2.
迪杰斯特拉算法是图论中计算最短路径的经典算法,但在实际使用中该算法耗费大量的计算时间和存储空间。通过对传统迪杰斯特拉算法的深入分析,在计算时间和存储空间上对该算法提出了一种新的优化方案,并给出了优化后的详细算法。改进算法从消除冗余计算和冗余存储入手,采用链表数组作为存储结构。经算法复杂度分析,优化后的迪杰斯特拉算法在求解最短路径问题时在时间和空间复杂度上都有明显的提高。该优化算法操作性强,具有一定的实用价值。  相似文献   

3.
基于分子动力学模拟的改进混合蛙跳算法   总被引:1,自引:0,他引:1  
针对基本的混合蛙跳算法(Shuffled frog leaping algorithm,SFLA)后期搜索速度变慢,容易陷入局部最优解的缺点,借鉴分子动力学(Molecular dynamics,MD)模拟的思想,提出一种基于分子动力学模拟的改进的混合蛙跳算法。该算法将种群中的粒子等效成分子,并提出一种新的分子间作用力计算方法来代替两体间经典的Lennard-Jones作用力计算方法,利用Velocity-Verlet算法和高斯变异算子代替基本混合蛙跳算法的更新策略,有效地平衡了种群的多样性和搜索的高效性。高维多峰函数测试的结果表明,基于分子动力学模拟的改进混合蛙跳算法能提高算法后期跳出局部极值的能力,全局寻优能力明显优于基本的混合蛙跳算法。  相似文献   

4.
基于十字链表的Apriori改进算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对Apriori算法中存在的不足,提出一种把事务数据库映射到十字链表中的改进算法。该算法可以减少连接数据库的次数及事务记录的扫描次数。Apriori算法与改进算法的性能对比分析表明,改进算法能有效提高执行效率。  相似文献   

5.
基于磁盘性能模型的优化调度算法   总被引:6,自引:0,他引:6  
总结分析了现阶段流行的一般磁盘调度算法和实时磁盘调度算法,并针对存储的实业业务的特性,提出了改进的调度算法,建立相对应的数学模型,最后通过模拟实验,验证了算法的有效性。  相似文献   

6.
分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合Nvidia Tesla V100 GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMDblue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。  相似文献   

7.
为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并行效率。实验结果表明,对比之前的Critical算法,该算法的加速比和并行效率均有较大幅度的提高。  相似文献   

8.
传统的并行计算的性能评价模型是加速比,文中讨论了加速比的缺点和不足,在此基础上提出了一种新的优化并行计算的性能评价模型(我们称之为优化加速比)。利用优化加速比分析了NAS基准测试程序MG和FT在IBM SP2(66mhz/wn)上的性能。  相似文献   

9.
张帅  徐顺  刘倩  金钟 《计算机科学》2018,45(10):291-294, 299
分子动力学模拟存在空间和时间的复杂性,并行加速分子的模拟过程尤为重要。基于GPU硬件数据并行架构的特点,组合分子动力学模拟的原子划分和空间划分的并行策略,优化实现了短程作用力计算Cell Verlet算法,并对分子动力学核心基础算法的GPU实现做了优化和性能分析。Cell Verlet算法实现首先采用原子划分的方式,将每个粒子的模拟计算任务映射到每个GPU线程,并采用空间划分的方式将模拟区域进行元胞划分,建立元胞索引表,实现粒子在模拟空间的实时定位;而在计算粒子间的作用力时,引入希尔伯特空间填充曲线方法来保持数据的线性存储与数据的三维空间分布的局部相关性,以便通过缓存加速GPU的全局内存访问;也利用了访存地址对齐和块内共享等技术来优化设计GPU分子动力学模拟过程。实例测试与对比分析显示,当前的算法实现具有强可扩展性和加速比等优势。  相似文献   

10.
11.
徐教显  王雅文 《软件》2013,(12):10-13
为了解决代码测试系统测试C项目的时间开销较大这一问题,本文提出了一种基于缓存估算模型的性能优化方法。该方法向代码测试系统中引入了缓存技术,并且建立了缓存规模估算模型。不相似的C项目应用该模型计算出的缓存规模是不一样的。使用缓存规模估算模型后,代码测试系统文件缓存的规模能够随着C项目的改变而发生改变,具有动态变化的能力。缓存估算模型已在系统中实现,对4个开源C项目的测试结果表明:该优化方法能有效地提高代码测试系统测试C项目时的时间性能。  相似文献   

12.
Optimization in Simulation is an important problem often encountered in system behavior investigation; however, the existing methods such as response surface methodology and stochastic approximation method are inefficient. This paper presents a modification of a quasi-Newton method, in which the parameters are determined from some numerical experiments. To demonstrate the validity of the devised method, two examples resembling the M/M/1 queueing problem are solved. The closeness of the converged solutions to the optimal solutions and a comparison with two stochastic approximation methods indicate that the modified quasi-Newton method as devised in this paper is a robust and efficient method for solving optimization problems in simulation.  相似文献   

13.
开发高性能仿真程序的前提是选择合适的并行计算平台以及明确程序的并行优化方向。为此,研究了并行计算平台和高性能仿真程序之间的适用性。重点提炼出仿真程序特性集合、并行计算平台的性能指标体系和并行优化目标要素集合,从而使平台选择和程序优化技术有更完善的理论指导。基于这三项研究,提出了确定程序适用性和平台适用性的方法。实例分析表明,研究成果能够指导选择适合的并行计算平台,以及指导开发面向平台性能的并行优化技术。  相似文献   

14.
计算机模拟是多媒体网络性能评价的一种重要手段。该文在分析多媒体网络特点及其性能评价指标的基础上,着重讨论了运用计算机模拟技术对多媒体网络进行性能评价的方法。还根据讨论结果完成了一个模拟实验,对一个特定多媒体网络在不同多媒体业务下的一些性能指标进行了分析,并根据分析结果,给出了该性能指标的性能空间。  相似文献   

15.
分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,我们发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此我们应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3%。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27%。  相似文献   

16.
In this paper we investigate the performance of distributed heuristic search methods based on a well-known heuristic search algorithm, the iterative deepening A* (IDA*). The contribution of this paper includes proposing and assessing a distributed algorithm for IDA*. The assessment is based on space, time and solution quality that are quantified in terms of several performance parameters such as generated search space and real execution time among others. The experiments are conducted on a cluster computer system consisting of 16 hosts built around a general-purpose network. The objective of this research is to investigate the feasibility of cluster computing as an alternative for hosting applications requiring intensive graph search. The results reveal that cluster computing improves on the performance of IDA* at a reasonable cost.  相似文献   

17.
祝永志  田甜 《计算机科学》2010,37(12):287-291
可扩展性是并行计算系统的重要性能指标,虽然异构系统越来越普遍,但对其可扩展性的研究还很少。给出了一种既适合同构并行计算系统又适合异构并行计算系统的效率的定义,根据访定义对可扩展性进行了分析,得出了既适用于同构系统又适用于异构系统的等效率模型,并根据开销比得出了在某一效率常数保持一致的情况下系统规模和工作负载的变化情况。最后通过实验进行了分析,结果表明该模型可以对效率和可扩展性进行较好的评测,并能预测并行计算系统的高可扩展性。  相似文献   

18.
随着数据库应用系统中数据的增加,效率是将是数据库应用开发与管理过程中必须解决的主要问题。因此必须对数据库进行优化。其中既包括了对逻辑数据库设计的优化、物理数据库硬件的优化、服务器硬件平台性能的优化、以及SQL语句本身查询的优化。本文通过对SQL Server数据库应用中影响效率的主要问题进行相应的分析,给出了数据库的性能优化方法,从而提高了整个数据库的运行效率。  相似文献   

19.
VHDL-AMS语言支持连续系统和连续/离散混合系统的描述与模拟,其中新增加的中断语句用于描述连续系统出现的不连续性行为.分析了目前模拟器在中断语句的中断列表的模拟方面存在的问题,提出用列方程计算与直接计算的结合法求解预定义属性Q’dot,Q’integ的解决方法.最后通过实例模拟验证了文中方法的正确性和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号