排序方式: 共有33条查询结果,搜索用时 15 毫秒
1.
GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一个复杂离子液体模拟算例为目标,使用GPU性能分析工具rocprof对移植代码进行了性能分析。针对MI50硬件特性,先后对成键力核函数、静电力的PME核函数和短程非成键力核函数进行了优化,优化后运行目标算例的性能相比初始版本整体上获得了约2.8倍的加速比,在 MI50上的性能高于GROMACS原版OpenCL代码60.5%,相对纯CPU版本有约2.7倍的加速比。在另外2个具有代表性算例的单结点测试以及离子液体算例的多结点扩展性测试中,优化后的代码也达到了较好的性能提升,这表明所采用的优化操作具有一定的通用性。 相似文献
2.
3.
4.
5.
6.
低渗透油藏受特殊的成藏条件、沉积环境影响,具有孔隙结构复杂、孔喉半径细小,油藏渗透率低,一般小于50×10-3μm2;储层非均质严重,平面渗透率级差最高达几百个数量级;驱替压力大、存在一定的启动压力;天然裂缝发育且存在人工裂缝等特点;因此,在不同渗透率级差下,如何建立起有效的驱替半径,建立合理、经济的井网密度,对提高低渗油藏水驱油效率及采收率,提高低渗透油藏的开发水平具有十分重要的意义。以低渗透油藏河135断块区为例,通过系统地对河135断块区储层非均质、裂缝进行研究,建立储层非均质—裂缝模型,在地质研究的基础上,针对不同渗透率级别、不同沉积相带,确定了不同的技术极限井距及经济合理井距,并考虑裂缝推出了适合的井网形式。 相似文献
7.
根据当地工程地质条件,清华洞水库的建设因地制宜地利用盲谷进行堵洞蓄水成库,采用H型混凝土堵洞体作为水库的挡水建筑物,打破了常规的大坝型式,具有结构可靠、工程量小的优点。混凝土堵洞体在清华洞水库工程应用中技术上的成功和较好的经济效益,对在岩溶地区兴建类似的水利工程具有一定指导意义。 相似文献
8.
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。 相似文献
10.
Due to the huge size of patterns to be searched,multiple pattern searching remains a challenge to several newly-arising applications like network intrusion detection.In this paper,we present an attempt to design efficient multiple pattern searching algorithms on multi-core architectures.We observe an important feature which indicates that the multiple pattern matching time mainly depends on the number and minimal length of patterns.The multi-core algorithm proposed in this paper leverages this feature to decompose pattern set so that the parallel execution time is minimized.We formulate the problem as an optimal decomposition and scheduling of a pattern set,then propose a heuristic algorithm,which takes advantage of dynamic programming and greedy algorithmic techniques,to solve the optimization problem.Experimental results suggest that our decomposition approach can increase the searching speed by more than 200% on a 4-core AMD Barcelona system. 相似文献