期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	26篇
免费	2篇
国内免费	5篇

专业分类

电工技术	1篇
水利工程	1篇
石油天然气	6篇
一般工业技术	4篇
自动化技术	21篇

出版年

2023年	1篇
2022年	1篇
2021年	5篇
2020年	1篇
2019年	4篇
2016年	1篇
2014年	3篇
2013年	1篇
2012年	1篇
2011年	3篇
2009年	1篇
2007年	3篇
2006年	7篇
2005年	1篇

排序方式： 共有33条查询结果，搜索用时 171 毫秒

1 [2] [3] [4] 下一页 » 末页»

GROMACS 2020在ROCm平台上的移植与优化

张驭洲曹武迪卜景德谭光明吉青《计算机工程与科学》2021,43(11):1901-1909

GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一个复杂离子液体模拟算例为目标,使用GPU性能分析工具rocprof对移植代码进行了性能分析。针对MI50硬件特性,先后对成键力核函数、静电力的PME核函数和短程非成键力核函数进行了优化,优化后运行目标算例的性能相比初始版本整体上获得了约2.8倍的加速比,在 MI50上的性能高于GROMACS原版OpenCL代码60.5%,相对纯CPU版本有约2.7倍的加速比。在另外2个具有代表性算例的单结点测试以及离子液体算例的多结点扩展性测试中,优化后的代码也达到了较好的性能提升,这表明所采用的优化操作具有一定的通用性。相似文献

国产异构系统上HPL的优化与分析

水超洋于献智王银山谭光明《软件学报》2021,32(8):2319-2328

随着异构系统成为建造超级计算机的重要选择,如何让CPU与加速器协调工作以充分发挥异构系统的计算性能具有重要意义.HPL是高性能计算领域最重要的基准测试程序,传统面向纯CPU系统的HPL算法通过加速器加速矩阵乘法的做法已经无法取得很好的性能.针对这一问题,提出了基于国产处理器-国产加速器异构系统的HPL性能模型和多线程细粒度流水HPL算法.完成了一个轻量级跨平台异构加速框架HPCX,以实现跨平台的HPL算法.该性能模型能够准确地预测类似异构系统的HPL性能.该HPL算法在NVIDIA GPU平台上性能超过了NVIDIA官方闭源nvhpl程序9%.在国产处理器-国产加速器平台512个节点的规模上,优化的HPL算法实现了2.3 PFLOPS实测峰值性能和71.1%的浮点效率. 相似文献

Gene Panel流程的并行设计与优化研究

王元戎曾平臧大伟谭光明孙凝晖《计算机学报》2019,42(11)

相似文献

面向软硬件协同设计的性能优化框架

骆裕龙谭光明孙凝晖《高技术通讯》2014,(10)

面对高性能计算机系统随着性能的提高其复杂性成倍增大的挑战,研究了复杂科学计算应用的优化,提出了一种面向软硬件特性设计的性能优化框架CPTF。该框架根据应用在运行时的剖析结果,结合应用的软件特性和平台的硬件特性,全局性地分析系统性能瓶颈及种类,并给出源码级的优化建议,并针对优化循环一类常见的问题,提出一种改进的循环合并算法。使用CPTF优化了一个物质点法粒子模拟应用,取得了近20%的性能提升。相似文献

清华洞水库工程混凝土堵洞体布置及结构型式分析

卢晓鹏谭光明《水利水电技术》2012,43(12):52-54,56

根据当地工程地质条件，清华洞水库的建设因地制宜地利用盲谷进行堵洞蓄水成库，采用H型混凝土堵洞体作为水库的挡水建筑物，打破了常规的大坝型式，具有结构可靠、工程量小的优点。混凝土堵洞体在清华洞水库工程应用中技术上的成功和较好的经济效益，对在岩溶地区兴建类似的水利工程具有一定指导意义。相似文献

低渗透油藏井网优化技术研究——以河135断块区为例

谭光明《海洋石油》2007,27(1):49-57

低渗透油藏受特殊的成藏条件、沉积环境影响,具有孔隙结构复杂、孔喉半径细小,油藏渗透率低,一般小于50×10-3μm2;储层非均质严重,平面渗透率级差最高达几百个数量级;驱替压力大、存在一定的启动压力;天然裂缝发育且存在人工裂缝等特点;因此,在不同渗透率级差下,如何建立起有效的驱替半径,建立合理、经济的井网密度,对提高低渗油藏水驱油效率及采收率,提高低渗透油藏的开发水平具有十分重要的意义。以低渗透油藏河135断块区为例,通过系统地对河135断块区储层非均质、裂缝进行研究,建立储层非均质—裂缝模型,在地质研究的基础上,针对不同渗透率级别、不同沉积相带,确定了不同的技术极限井距及经济合理井距,并考虑裂缝推出了适合的井网形式。相似文献

Revisiting Multiple Pattern Matching Algorithms for Multi-Core Architecture

下载免费PDF全文

谭光明刘萍卜东波刘燕兵《计算机科学技术学报》2011,26(5):866-874

Due to the huge size of patterns to be searched,multiple pattern searching remains a challenge to several newly-arising applications like network intrusion detection.In this paper,we present an attempt to design efficient multiple pattern searching algorithms on multi-core architectures.We observe an important feature which indicates that the multiple pattern matching time mainly depends on the number and minimal length of patterns.The multi-core algorithm proposed in this paper leverages this feature to decompose pattern set so that the parallel execution time is minimized.We formulate the problem as an optimal decomposition and scheduling of a pattern set,then propose a heuristic algorithm,which takes advantage of dynamic programming and greedy algorithmic techniques,to solve the optimization problem.Experimental results suggest that our decomposition approach can increase the searching speed by more than 200% on a 4-core AMD Barcelona system. 相似文献

无锁同步的细粒度并行介度中心算法 总被引：1，自引：0，他引：1

涂登彪谭光明孙凝晖《软件学报》2011,22(5):986-995

通过结合体系结构和算法进行研究发现,基于锁的同步机制是细粒度并行介度中心(betweenness centrality,简称BC)算法在现有多核平台上高效执行的主要瓶颈.提出了一种消除锁同步的数据驱动(data-centric)并行算法,在AMD 32核SMP和Intel8核SMP两个平台上获得了2倍左右的加速比. 相似文献

面向FPGA的RNA二级结构预测并行算法研究

徐琳李晓民谭光明刘新春卜东波冯圣中孙凝晖《计算机学报》2006,29(2):233-238

动态规划是RNA二级结构预测最主要的算法，文中提出一种对动态规划矩阵采用分块技术的细粒度并行算法，通过对数据依赖关系的分析，引入了流水的策略，提高了算法的效率,在时钟模拟器上验证了算法的正确性，获得了一系列关于并行加速比、空泡率、存储访问带宽等问题的模拟结果，确定了FPGAPE阵列设计中的基本参数，为FPGA成功实现奠定了基础。相似文献

10.

基于SSE2的Smith-Waterman算法

戴正华张庆丹徐琳谭光明冯圣中《计算机工程与应用》2006,42(11):85-87

Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。相似文献

1 [2] [3] [4] 下一页 » 末页»