期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《数据与计算发展前沿》2022,4(5)

相似文献

2.

平宇向阳张波黄寅飞《计算机工程》2014,(2):31-34,38

分布式网络爬虫的广泛应用使得搜索引擎的数据规模呈几何式增长,面对数以TB甚至PB量级的数据,单机模式下的PageRank算法由于CPU、I/O和内存的开销过大导致效率低下。为此,提出一种基于MapReduce框架的并行PageRank算法。在算法的一次迭代过程中,利用Map函数对网页拓扑信息文件进行解析,使用Reduce函数计算网页得分,从而并行化PageRank算法的中间迭代过程。通过计算全局网页得分控制迭代次数,得到较精确的网页排序结果。实验结果表明,该算法在保持原有单机PageRank算法整体网页排序精度的基础上,具有较好的集群性能和较快的执行速度。相似文献

3.

并行异构系统中的一种高效任务调度算法 总被引：1，自引：0，他引：1

蒋韵联孙广中许胤龙《计算机工程》2007,33(11):39-41

并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随机任务图和高斯迭代任务图进行模拟,与已有算法相比,新算法的效率有很大的提高。相似文献

4.

异构并行平台的Caffe推理速度提升方法

下载免费PDF全文

王子曦邵培南邓畅《计算机系统应用》2022,31(2):220-226

随着计算机硬件性能的提高,目前在个人终端上也开始出现使用预训练机器学习模型进行推理的运用.Caffe是一款流行的深度学习框架,擅长图像分类等任务,但是在默认状态下只能单核运行,无法充分发挥异构并行计算设备的计算能力.深度学习对于计算性能的要求较高,如果能并行化以充分使用所有计算设备,就能提升计算速度和使用体验.由于CP... 相似文献

5.

基于事件的异构平台并行程序性能可视化研究

顾慧郑晓薇申安来逯文晖《计算机工程与设计》2010,31(24)

为了便于用户快速、直观地了解到机群系统中并行应用程序的性能情况,将Linux计算机群与Windows控制显示平台相结合,提出了一种基于事件的异构平台并行程序性能可视化方法.该方法以MPI作为底层编程环境,在高层使用MPE技术,依据动态性能检测方式获取程序执行过程信息;设计C#语言及Jumpshot日志图形化分析集成工具实现并行程序性能可视化.实验结果表明,该方法可准确,直观地反映程序性能信息,有助于程序员简便、有效地对并行程序进行量化分析,对提高机群系统的可用性、改善程序性能及效率等方面具有较高的实用价值. 相似文献

6.

一种用于异构环境中任务调度的高效算法

下载免费PDF全文

刘侃侃《计算机系统应用》2010,19(11):102-105

在异构计算环境中,有效的任务调度对于获得高性能是十分重要的。现在虽然已经有许多异构处理器调度算法,但它们或者不具有良好的效果,或者算法代价太高。提出了一种新的基于表的调度算法APS。APS利用有向无环图来计算任务优先级,并采用基于调度的策略分配任务到不同处理器,以获得任务最少完工时间。将APS和LMT,HEFT,CPOP算法做比较之后得出：在大多数情况下APS算法都能获得更好性能。相似文献

7.

异构型数据库通信平台实现技术 总被引：2，自引：0，他引：2

张水平万映辉卢潇陈靖《计算机工程》2000,26(2):100-101

主要论述了异构型数据库通信平台的实现技术。在异构网络环境下为用户提供了一个界面友好,操作方便灵活,集数据转储、数据操作于一体的集成化平台。相似文献

8.

面向异构计算机平台的HPL方案

下载免费PDF全文

孙乔孙家昶马文静赵玉文《软件学报》2021,32(8):2329-2340

HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.在Hetero-HPL中... 相似文献

9.

分布异构工作站上的任务调度算法

邬延辉陆鑫达曾志勇《小型微型计算机系统》2004,25(4):733-737

讨论了在一个由高速局域网连接的高性能异构工作站平台上，如何有效地利用空闲工作站来求解计算密集型任务矩阵相乘的问题，为了获得较好的并行计算性能，文中给出了一个异构工作站群之间任务调度的模型和算法，算法中考虑了并行计算中协作任务间的通信时间、数据加栽时间、结果收集时间和各个异构工作站的任务计算时间，通过这个模型，可以在所有可利用的工作站集合中找出最适合的子集，获得最短的执行时间．相似文献

10.

异构处理器间的一种图形并行生成方法

唐贵川杨红雨《计算机研究与发展》1998,35(6):558-561

图形任务计算的复杂性及实时性要求高速计算。文中提出了一种异构处理器间的图形并行生成方法，在层次分割和多主体协作模式下，各处理器并行运作，一方面有效利用了环境中的计算资源，另一方面提高了各处理器的计算并行度。相似文献

11.

Lanjun Wan Xueyan Cui Yuanyuan Li Weihua Zheng Xinpan Yuan 《Concurrency and Computation》2024,36(11):e8014

Heterogeneous platforms composed of multiple different types of computing devices (such as CPUs, GPUs, and Intel MICs) have been widely used recently. However, most of parallel applications developed in such a heterogeneous platform usually only utilize a certain kind of computing device due to the lack of easy-to-use heterogeneous cooperative parallel programming models. To reduce the difficulty of heterogeneous cooperative parallel programming, a directive-based heterogeneous cooperative parallel programming framework called HeteroPP is proposed. HeteroPP provides an easier way for programmers to fully exploit multiple different types of computing devices to concurrently and cooperatively perform data-parallel applications on heterogeneous platforms. An extension to OpenMP directives and clauses is proposed to make it possible for programmers to easily offload a data-parallel compute kernel to multiple different types of computing devices. A source-to-source compiler is designed to help programmers to automatically generate multiple device-specific compute kernels that can be concurrently and cooperatively performed on heterogeneous platforms. Many experiments are conducted with 12 typical data-parallel applications implemented with HeteroPP on a heterogeneous CPU-GPU-MIC platform. The results show that HeteroPP not only greatly simplifies the heterogeneous cooperative parallel programming, but also can fully utilize the CPUs, GPU, and MIC to efficiently perform these applications. 相似文献

12.

面向异构计算的高性能计算算法与软件

下载免费PDF全文

徐顺王武张鉴姜金荣金钟迟学斌《软件学报》2020,31(7)

研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题,对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.本文首先简要介绍高性能计算应用软件的现状、趋势和面临挑战,并对几类典型高性能计算应用软件开展并行计算算法特征分析,涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计算化学和格点量子色力学等多个问题、尺度和领域.其次,我们讨论了面向国产异构计算系统的对策,提炼出若干典型应用算法和软件的共性问题,涉及核心算法、算法发展、优化策略等.最后,本文面向异构计算体系结构对高性能计算算法与软件进行了总结. 相似文献

13.

面向异构计算的高性能计算算法与软件

下载免费PDF全文

徐顺王武张鉴姜金荣金钟迟学斌《软件学报》2021,32(8):2365-2376

研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题,对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.首先,简要介绍高性能计算应用软件的现状、趋势和面临挑战,并对几类典型高性能计算应用软件开展并行计算算法特征分析,涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计... 相似文献

14.

基于OpenCL的雷达外推算法改进与优化

王兴 ;苗春生 ;王秀君 ;樊仲欣《计算机与现代化》2014,(8):81-86

基于雷达资料的外推是临近预报中重要的方法之一,随着全国气象雷达网络建设规模的不断提高以及观测资料精细化程度的提升,基于区域乃至全国雷达拼图的外推预报,每次计算都需花费大量时间,甚至滞后于每6分钟一次的资料观测频次。为解决传统外推算法运算复杂度高,实时性差的问题,运用OpenCL构建基于GPU的异构计算模型对外推算法进行并行化改进。然后逐步分析影响算法性能的瓶颈,并通过改进和测试数据比对,阐述算法优化的过程。其中,内存与线程的映射优化、合理利用局部存储器作为高速缓存以及隐藏CPU执行时间等方法不仅对本算法的执行效率带来显著提升,也可为其他基于OpenCL异构计算的优化提供参考。以AMD Graphic Core Next和Northern Islands二代GPU架构作为测试平台,并以Intel CPU并行计算作为测试参考,测试结果表明,改进后的算法在硬件同等功耗的情况下,计算性能提升15~22倍。相似文献

15.

异构集群系统的可分负载多轮调度算法*

李显宁钟诚杨锋《计算机应用研究》2008,25(4):1028-1032

针对更实际的异构集群计算环境,充分考虑处理机具有不同的计算速度、通信能力和存储容量的特性,通过允许计算和通信操作重叠执行,采取多次并行分配计算任务的方法,设计一种可分负载多轮调度算法。实验结果表明,该算法不但能获得与均匀多轮调度(UMR)算法相当的渐近最优调度时间长度,并且能够处理更大规模的应用负载,实用性更强。相似文献

16.

二维泊松问题的并行共轭梯度算法

ZHAO Hang-tao 《数字社区&智能家居》2008,(27)

该论文研究了利用并行共轭梯度算法求解二维泊松方程的方法,在由24台微机组成的机群上进行了实验。实验数据表明并行共轭梯度算法适用于求解二维泊松方程,它具有收敛快,可扩展性强的特点。在实验的基础上提出并验证了适用于并行共轭梯度算法的合理计算节点数的选择函数。相似文献

17.

Anshu Dubey Klaus Weide Dongwook Lee John Bachan Christopher Daley Samuel Olofin Noel Taylor Paul M. Rich Lynn B. Reid 《Software》2015,45(2):233-244

When developing a complex, multi‐authored code, daily testing on multiple platforms and under a variety of conditions is essential. It is therefore necessary to have a regression test suite that is easily administered and configured, as well as a way to easily view and interpret the test suite results. We describe the methodology for verification of FLASH, a highly capable multiphysics scientific application code with a wide user base. The methodology uses a combination of unit and regression tests and an in‐house testing software that is optimized for operation under limited resources. Although our practical implementations do not always comply with theoretical regression‐testing research, our methodology provides a comprehensive verification of a large scientific code under resource constraints.Copyright © 2013 John Wiley & Sons, Ltd. 相似文献

18.

一种高效的并行定性仿真方法TPQSIM 总被引：14，自引：0，他引：14

涂永忠白方周方瑾陈忠保邵晨曦《计算机学报》2000,23(5):459-469

对定性仿真中流行的ＱＳＩＭ算法进行了较为详细的剖析,介绍了ＱＳＩＭ算法内核函数的动态特性和数据流关系,在此基础上,提出了并行ＱＳＩＭ算法ＴＰＱＳＩＭ,并在曙光１０００并行机上通过实验对该算法进行了评估。试验结果表明,ＴＰＱＳＩＭ算法在效率和通用性等方面均明显超过了国外同类研究成果。相似文献

19.

近优可扩展性：一种实用的可扩展性度量 总被引：2，自引：0，他引：2

陈军李晓梅《计算机学报》2001,24(2):179-182

良好的可扩展性是并行算法和并行机设计人员追求的一项重要性能指标,以往的可扩展模型都只是孤立地考虑了问题的某个侧面,比如某种性能或最大可利用资源,而没有从整体上进行权衡。这些可扩展模型可以满足计算机研究人员的需要,因为他们关注于更高的效率和利用率。但应用科学家更强调短小的执行时间。文中提出的近优可扩展模型,它同时考虑了并行系统的效率和执行两个因素。在一个典型MPP上的两个算法实例分析表明,该可扩展模型不仅可以描述并行算法的可扩展能力,而且,当按照适当的可扩展曲线扩展时,可以使得执行时间接近量短,而效率不低,这对算法和并行机的最优匹配有指导作用,同时有益于并行算法设计和改进。相似文献