首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   26篇
  免费   2篇
  国内免费   5篇
电工技术   1篇
水利工程   1篇
石油天然气   6篇
一般工业技术   4篇
自动化技术   21篇
  2023年   1篇
  2022年   1篇
  2021年   5篇
  2020年   1篇
  2019年   4篇
  2016年   1篇
  2014年   3篇
  2013年   1篇
  2012年   1篇
  2011年   3篇
  2009年   1篇
  2007年   3篇
  2006年   7篇
  2005年   1篇
排序方式: 共有33条查询结果,搜索用时 171 毫秒
1.
GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一个复杂离子液体模拟算例为目标,使用GPU性能分析工具rocprof对移植代码进行了性能分析。针对MI50硬件特性,先后对成键力核函数、静电力的PME核函数和短程非成键力核函数进行了优化,优化后运行目标算例的性能相比初始版本整体上获得了约2.8倍的加速比,在 MI50上的性能高于GROMACS原版OpenCL代码60.5%,相对纯CPU版本有约2.7倍的加速比。在另外2个具有代表性算例的单结点测试以及离子液体算例的多结点扩展性测试中,优化后的代码也达到了较好的性能提升,这表明所采用的优化操作具有一定的通用性。  相似文献   
2.
随着异构系统成为建造超级计算机的重要选择,如何让CPU与加速器协调工作以充分发挥异构系统的计算性能具有重要意义.HPL是高性能计算领域最重要的基准测试程序,传统面向纯CPU系统的HPL算法通过加速器加速矩阵乘法的做法已经无法取得很好的性能.针对这一问题,提出了基于国产处理器-国产加速器异构系统的HPL性能模型和多线程细粒度流水HPL算法.完成了一个轻量级跨平台异构加速框架HPCX,以实现跨平台的HPL算法.该性能模型能够准确地预测类似异构系统的HPL性能.该HPL算法在NVIDIA GPU平台上性能超过了NVIDIA官方闭源nvhpl程序9%.在国产处理器-国产加速器平台512个节点的规模上,优化的HPL算法实现了2.3 PFLOPS实测峰值性能和71.1%的浮点效率.  相似文献   
3.
4.
面对高性能计算机系统随着性能的提高其复杂性成倍增大的挑战,研究了复杂科学计算应用的优化,提出了一种面向软硬件特性设计的性能优化框架CPTF。该框架根据应用在运行时的剖析结果,结合应用的软件特性和平台的硬件特性,全局性地分析系统性能瓶颈及种类,并给出源码级的优化建议,并针对优化循环一类常见的问题,提出一种改进的循环合并算法。使用CPTF优化了一个物质点法粒子模拟应用,取得了近20%的性能提升。  相似文献   
5.
根据当地工程地质条件,清华洞水库的建设因地制宜地利用盲谷进行堵洞蓄水成库,采用H型混凝土堵洞体作为水库的挡水建筑物,打破了常规的大坝型式,具有结构可靠、工程量小的优点。混凝土堵洞体在清华洞水库工程应用中技术上的成功和较好的经济效益,对在岩溶地区兴建类似的水利工程具有一定指导意义。  相似文献   
6.
谭光明 《海洋石油》2007,27(1):49-57
低渗透油藏受特殊的成藏条件、沉积环境影响,具有孔隙结构复杂、孔喉半径细小,油藏渗透率低,一般小于50×10-3μm2;储层非均质严重,平面渗透率级差最高达几百个数量级;驱替压力大、存在一定的启动压力;天然裂缝发育且存在人工裂缝等特点;因此,在不同渗透率级差下,如何建立起有效的驱替半径,建立合理、经济的井网密度,对提高低渗油藏水驱油效率及采收率,提高低渗透油藏的开发水平具有十分重要的意义。以低渗透油藏河135断块区为例,通过系统地对河135断块区储层非均质、裂缝进行研究,建立储层非均质—裂缝模型,在地质研究的基础上,针对不同渗透率级别、不同沉积相带,确定了不同的技术极限井距及经济合理井距,并考虑裂缝推出了适合的井网形式。  相似文献   
7.
Due to the huge size of patterns to be searched,multiple pattern searching remains a challenge to several newly-arising applications like network intrusion detection.In this paper,we present an attempt to design efficient multiple pattern searching algorithms on multi-core architectures.We observe an important feature which indicates that the multiple pattern matching time mainly depends on the number and minimal length of patterns.The multi-core algorithm proposed in this paper leverages this feature to decompose pattern set so that the parallel execution time is minimized.We formulate the problem as an optimal decomposition and scheduling of a pattern set,then propose a heuristic algorithm,which takes advantage of dynamic programming and greedy algorithmic techniques,to solve the optimization problem.Experimental results suggest that our decomposition approach can increase the searching speed by more than 200% on a 4-core AMD Barcelona system.  相似文献   
8.
无锁同步的细粒度并行介度中心算法   总被引:1,自引:0,他引:1  
通过结合体系结构和算法进行研究发现,基于锁的同步机制是细粒度并行介度中心(betweenness centrality,简称BC)算法在现有多核平台上高效执行的主要瓶颈.提出了一种消除锁同步的数据驱动(data-centric)并行算法,在AMD 32核SMP和Intel8核SMP两个平台上获得了2倍左右的加速比.  相似文献   
9.
动态规划是RNA二级结构预测最主要的算法,文中提出一种对动态规划矩阵采用分块技术的细粒度并行算法,通过对数据依赖关系的分析,引入了流水的策略,提高了算法的效率,在时钟模拟器上验证了算法的正确性,获得了一系列关于并行加速比、空泡率、存储访问带宽等问题的模拟结果,确定了FPGAPE阵列设计中的基本参数,为FPGA成功实现奠定了基础。  相似文献   
10.
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号