期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	23篇
免费	10篇
国内免费	1篇

专业分类

电工技术	1篇
水利工程	1篇
石油天然气	6篇
一般工业技术	5篇
自动化技术	21篇

出版年

2024年	1篇
2023年	1篇
2022年	1篇
2021年	5篇
2020年	1篇
2019年	4篇
2016年	1篇
2014年	3篇
2013年	1篇
2012年	1篇
2011年	3篇
2009年	1篇
2007年	3篇
2006年	7篇
2005年	1篇

排序方式： 共有34条查询结果，搜索用时 15 毫秒

[首页] « 上一页 [1] [2] 3 [4] 下一页 » 末页»

21.

国产异构架构系统上HPL的优化与分析

下载免费PDF全文

水超洋于献智王银山谭光明《软件学报》2020,31(7)

随着异构系统成为建造超级计算机的重要选择,如何让CPU与加速器协调工作以充分发挥异构系统的计算性能具有重要意义.HPL是高性能计算领域最重要的基准测试程序,传统面向纯CPU系统的HPL算法通过利用加速器加速矩阵乘法的做法已经无法取得很好的性能.针对这一问题,本文基于新的国产处理器-国产加速器异构系统提出了一个新的HPL性能模型,设计了一种全新的多线程细粒度异构HPL算法.我们完成了一个轻量级跨平台异构加速框架HPCX用来实现跨平台的HPL算法.我们的性能模型能够准确的预测类似异构系统的HPL性能,我们的多线程细粒度异构HPL算法在NVIDIA GPU平台上性能超过目前NVIDIA平台上性能最好的NVIDIA官方闭源nvhpl程序9%.在国产处理器-国产加速器平台512节点的规模上,我们的新HPL算法实现了2.3PFLOPS实测峰值性能和71.1%的浮点效率. 相似文献

22.

RNA二级结构预测中动态规划的优化和有效并行 总被引：6，自引：0，他引：6

下载免费PDF全文

谭光明冯圣中孙凝晖《软件学报》2006,17(7):1501-1509

基于最小自由能模型的方法是计算生物学中RNA二级结构预测的主要方法,而计算最小自由能的动态规划算法需要O(n⁴)的时间,其中n是RNA序列的长度.目前有两种降低时间复杂度的策略:限制二级结构中内部环的大小不超过k,得到O(n²×k²)算法;Lyngso方法根据环的能量规则,不限制环的大小,在O(n3)的时间内获得近似最优解.通过使用额外的O(n)的空间,计算内部环中的冗余计算大为减少,从而在同样不限制环大小的情况下,在O(n³)的时间内能够获得最优解.然而,优化后的算法仍然非常耗时,通过有效的负载平衡方法,在机群系统上实现并行程序.实验结果表明,并行程序获得了很好的加速比. 相似文献

23.

边缘海静力数值预报模式并行算法研究

逄仁波张云泉谭光明徐建良贾海鹏解庆春《计算机科学》2016,43(1):14-17, 29

边缘海静力数值模式是国内针对边缘海特点自主开发的数值预报模式,但该模式因物理求解方程较多且采用不宜并行化的SOR求解算法而程序计算时间过长。针对上述问题,提出基于三维网格和海洋模式特点的SOR并行求解算法,该算法在保留三维网格数据间依赖关系的同时,有效解决了SOR迭代算法难以并行化的问题。同时,引入通信避免算法,采用MPI非阻塞通信方式,细分计算和通信过程,利用计算有效隐藏通信开销,提高了并行程序效率。实验结果表明,并行后的边缘海静力数值模式程序的性能相对串行程序提升了60.71倍,3天(25920计算时间步)预报结果的均方根误差低于0.001,满足海洋数值预报的时效性和精度要求。相似文献

24.

基于GPU的子图匹配优化技术

孟轲林志恒谭光明《高技术通讯》2022,32(1):1-12

为了解决图挖掘应用中子图匹配任务的性能问题,本文提出了一种基于图形处理单元(GPU)的顶点预剪枝子图匹配系统(GVSM).GVSM采用黑名单剪枝算法和调度排序来减少冗余搜索.利用前缀树数据结构,GVSM可以对中间结果进行压缩,以便快速索引并降低内存消耗.GVSM将子图匹配的搜索部分卸载到GPU上执行,通过设计软件流水线... 相似文献

25.

基于定制协处理器的基因重测序加速技术研究

下载免费PDF全文

汤文张春明谭光明张佩珩孙凝晖《计算机研究与发展》2014,51(9):1980-1992

自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列(field programmable gate array, FPGA)作为协处理器的架构,并在Convey公司的HC-1ex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6 LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能. 相似文献

26.

不同矩阵分解方法对海洋数据同化的影响*

管志斌肖俊敏季统凯洪学海谭光明马岩《计算机科学与探索》2019,13(1):147-157

在海洋数据同化领域,集合最优插值方法中,矩阵求逆过程所使用的奇异值分解(singular value decomposition,SVD)十分耗时。对集合最优插值中逆矩阵的求逆过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解。首先,通过LU分解(Choleskey分解或QR分解)得到相应的三角矩阵(或正交矩阵);然后,利用分解后的矩阵来实现相关逆矩阵的计算。由于LU分解、Choleskey分解、QR分解的算法复杂度都远小于SVD分解,因此改进后的同化程序能得到大幅度的性能提升。数值结果表明,所采用的三种矩阵分解方法相比于SVD分解,都能将集合最优插值的计算效率提升至少两倍以上。值得一提的是,在四种矩阵分解中Choleskey分解使得整个同化程序的性能达到了最优。相似文献

27.

分布式深度学习训练网络综述

下载免费PDF全文

朱泓睿元国军姚成吉谭光明王展户忠哲张晓扬安学军《计算机研究与发展》2021,58(1):98-115

近年来深度学习在图像、语音、自然语言处理等诸多领域得到广泛应用,但随着人们对深度学习的训练速度和数据处理能力的需求不断提升,传统的基于单机的训练过程愈发难以满足要求,分布式的深度学习训练方法成为持续提升算力的有效途径．其中训练过程中节点间网络的通信性能至关重要,直接影响训练性能.分析了分布式深度学习中的性能瓶颈,在此基础上对目前常用的网络性能优化方案进行综述,详细阐述了目前最新的超大规模分布式训练的体系结构、优化方法、训练环境和最有效的优化方法,最后对分布式训练仍然存在的困难进行了总结,对其未来研究方向进行了展望. 相似文献

28.

面向HYCOM的高分辨率海洋数据同化并行算法优化

曹连雨张桂赵肖俊敏洪学海谭光明《计算机应用研究》2021,38(12):3611-3616

HYCOM(hybrid coordinate ocean model)海洋数值模式要求较高的吞吐量和相对较小的计算量,这给并行算法设计带来了巨大的挑战.针对具有高吞吐量的海洋数据同化问题,设计了一种基于区域分解的并行优化算法.首先,提出了一种灵活的文件访问方法,可以高效地从磁盘读取大量的数据,避免数据访问冲突,大幅降低磁盘寻址操作的频率.此外,设计了一种避免通信的策略,以一些额外的计算量为代价大幅减少进程间的通信量.最后,提出了一种基于管道流的通信策略,以实现无冲突的消息传递.实验结果表明,该算法与基线算法相比,总体性能提高了5倍,其中文件读取速度提升6倍,进程间的通信性能提升了2.7倍. 相似文献

29.

硼中子寿命测井技术应用研究——以现河庄油田为例

赵伟王海文刘延陈实谭光明《新疆石油地质》2007,28(3):372-374

胜利油区的现河庄油田，由数个面积较小且地质条件相对复杂的断块组成，目前已开采30多年，层间矛盾较为突出，大部分区块已进入高含水期，水淹严重。硼中子寿命测井技术作为近些年发展起来的一项重要的放射性测井技术，对于油田开发，特别是对于油藏高含水阶段的进一步开采，与其他测井方法相比有着独特的优势。介绍了硼中子寿命测井技术，着重阐述了该项技术在现河庄油田的应用情况，对几口典型井进行了重点剖析，从而为该技术在同类型油田的进一步应用，提供了借鉴。相似文献

30.

浅谈软土路基的处理方法

谭光明《中国科技博览》2011,(36):186-186

软土路基给公路工程建设带来很大困难,为了解决软土路基对施工的影响,必须对软土路基性质、处理方法加以软土路基的特点进行分析,并介绍一些常用的软土路基加固处理方法。相似文献

[首页] « 上一页 [1] [2] 3 [4] 下一页 » 末页»