期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	39篇
免费	1篇
国内免费	4篇

专业分类

电工技术	3篇
综合类	5篇
化学工业	1篇
机械仪表	2篇
建筑科学	5篇
无线电	1篇
一般工业技术	2篇
自动化技术	25篇

出版年

2023年	2篇
2022年	4篇
2021年	1篇
2019年	5篇
2018年	2篇
2017年	3篇
2014年	6篇
2013年	4篇
2012年	4篇
2011年	6篇
2010年	1篇
2009年	2篇
2008年	4篇

排序方式： 共有44条查询结果，搜索用时 218 毫秒

[首页] « 上一页 [1] 2 [3] [4] [5] 下一页 » 末页»

11.

异构系统编程方法综述

唐滔杨学军《计算机工程与科学》2012,34(3):29-34

由通用微处理器和专用加速器构成的异构并行系统比传统的同构系统显示出更高的性能和效能,目前已成为高性能计算领域的重要发展趋势。然而,编程问题成为限制异构系统发展的一大挑战,因此引起学术界和业界广泛关注。本文首先阐述了异构系统编程问题的来源;其次分析了近年来面向异构系统编程方法的研究工作,并对其进行分类;最后总结了异构系统编程方法未来的研究问题。相似文献

12.

Programming for scientific computing on peta-scale heterogeneous parallel systems

杨灿群吴强唐滔王锋薛京灵《中南工业大学学报(英文版)》2013,20(5):1189-1203

相似文献

13.

异构并行系统能耗优化分析模型

王桂彬杨学军唐滔徐新海《软件学报》2012,23(6):1382-1396

随着处理器功耗不断增大,功耗问题逐渐成为高性能计算机系统设计与实现的首要问题.当前,异构系统已成为高性能计算机的发展趋势之一.与传统同构体系结构相比,异构体系结构具有更高的理论峰值性能和能效,但是如何在满足应用性能的条件下充分发掘异构系统的能效优势,仍是一个挑战性问题.通过将应用程序抽象为由串行段和并行段组成的一般程序模型,建立了异构并行系统能耗优化模型通过分析方法依次给出并行段以及全程序(多程序段)能耗最优时处理器间满足的关系,分别给出了时间约束下能耗最优的处理器频率选择算法.最后,以CPU-GPU异构系统为平台,通过8个典型应用程序验证了方法的有效性. 相似文献

14.

多核/众核平台上推荐算法的实现与性能评估

陈静方建滨唐滔杨灿群《计算机科学》2017,44(10):71-74

用OpenCL语言标准设计并实现了推荐系统领域的两种经典算法:交替最小二乘法(Alternating Least Squares,ALS)与循环坐标下降法(Cyclic Coordinate Descent,CCD)。将其应用到CPU,GPU,MIC多核与众核平台上,探索了在该平台上影响算法性能的因子:潜在特征维数与线程个数。同时,将OpenCL实现的两种算法与CUDA和OpenMP的实现进行比较,得出了一系列结论。在同等条件下,与ALS算法相比,CCD算法的精度更高,收敛速度更快且更稳定,但所耗时间更长。ALS和CCD算法基于OpenCL的实现性能不亚于CUDA(CCD 上加速比为1.03x,ALS上加速比为1.2x)和OpenMP的实现(CCD与ALS上加速比大约为1.6~1.7x),并且两种算法在CPU平台上的性能均比GPU与MIC好。相似文献

15.

飞腾处理器与商用处理器性能比较

方建滨杜琦唐滔陈顼颢黄春杨灿群《计算机工程与科学》2019,41(1):1-8

深入分析了飞腾处理器FT 1500A与商用处理器Intel XEON在性能上的差异。在微基准测试层面，评测了两个平台能够达到的最大可获得性能（浮点性能、访存延迟和访存带宽）。在应用层面，选取一个典型的海洋预报数值模拟软件，研究了如何将一个开源代码移植到飞腾处理器和商用处理器上，探讨了该软件在两个平台上的单核性能与多核性能，分析了性能差异的原因并提出了相应的优化建议。认为FT 1500A已经有良好的生态基础（操作系统、编译器和工具链），使得移植典型科学计算程序简单可行，虽然跟商用平台相比，飞腾处理器在性能上存在着差距，但考虑到其在功耗上的优势，飞腾处理器将是一个非常具有应用前景的平台。相似文献

16.

模板操作在GPU上的实现与优化 总被引：1，自引：0，他引：1

方旭东唐玉华王桂彬唐滔《计算机工程与科学》2011,33(3):41

随着GPU的快速发展,使用GPU来加速科学计算应用已成为必然趋势。本文抽取了SPEC2000中富含模板操作的Mgrid的两个典型子程序Rprj3和Interp,使用Brook+语言把它们移植到AMD GPU上运行。采用Brook+语言提供的线程调节机制,我们实现了不同线程粒度下的程序版本,并分析了加速比不同的原因,总结了线程粒度调节对模板程序移植的指导意义。我们使用AMD RadeonHD4870 GPU作为实验平台,对比Intel Xeon E5405 CPU上的运行结果发现,在最大规模下,Rprj3获得的相对于CPU版本的加速比为5.37×,Interp获得的相对于CPU版本的加速比为12.8×。相似文献

17.

机车柴油机组合活塞的温度场数值模拟 总被引：1，自引：0，他引：1

唐滔冯春龚德文《机械设计与制造》2008,(11)

应用PRO/E软件对复杂的16v280zjA型柴油机活塞建立三维实体模型,确定活塞的换热边界条件,并借助于软件PRO/EMechanica计算出活塞在热载荷作用下的温度场,计算结果与实测结果基本相吻合.明确了活塞在工作过程中活塞关键部位的温度分布状况,对于工程技术人员来说,了解活塞的温度场具体分布,进而可以求得活塞的应力分布、变形分布情况,为进一步改进组合活塞的结构设计具有一定的参考价值. 相似文献

18.

飞腾1500A处理器性能分析工具Likwid研究 总被引：1，自引：0，他引：1

彭林方建滨杜琦唐滔黄春杨灿群《计算机工程与科学》2018,40(7):1147-1154

在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500A处理器的拓扑结构及相关概要信息;编写内核驱动模块使能飞腾1500A处理器的性能监控单元,指定事件类型,通过对应硬件计数器记录目标程序执行过程中事件发生的次数;结合简单代码和模板化的微基准测试程序,使用性能分析工具收集程序执行过程中相关数据,进行性能分析。相似文献

19.

一种面向CPU-GPU 异构系统的容错方法

徐新海杨学军林宇斐林一松唐滔《软件学报》2011,22(10):2538-2552

近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价. 相似文献

20.

西藏4000m以上高海拔地区变电站设计实践

唐滔易建山罗晓康罗忠军白小奇张勇李海龙柏延鹏《电力勘测设计》2021,(5):1-6

通过西藏阿里与藏中电网联网工程变电站的设计,结合西藏高海拔地区环境特征及其影响,对高海拔地区变电站的海拔修正系数选取、最小空气间隙取值、电气设备抗震及防低温措施等方面进行了论述,提出应对高海拔地区恶劣环境的措施. 相似文献

[首页] « 上一页 [1] 2 [3] [4] [5] 下一页 » 末页»