共查询到20条相似文献,搜索用时 78 毫秒
1.
分子动力学模拟作为获得液体、固体性质的重要计算手段,广泛应用于化学、物理、生物、医药、材料等众多领域。模拟体系的复杂性和精确性的需求,使得计算量巨大,耗费时间长。并行计算是加速大规模分子动力学模拟的霍要途径。GPU以几百GFlops甚至上I}Flops的运算能力,为分子动力学模拟等的计算密集型应用提供了新的加速方案。提出了一种基于GPU的分子动力学模拟并行算法—oApT-AD,并在OpenCL和CUDA框架下加以实现。,r}能测试显示,在Tesla C1060显卡上,该算法在OpcnCL框架下的实现相对于CPU的串行实现,最高达到120倍加遥比。通过对比发现,该算法在CUDA上的性能与()pcnCI、基本相当。同时,该算法还可以扩展到两块及以上的GPU上,具有良好的可扩展性。 相似文献
2.
3.
随着高维数据的涌现,张量和张量分解方法在数据分析领域中受到了广泛关注。然而,张量数据的高维度和稀疏特性,导致算法的复杂度较高, 阻碍了张量分解算法在实际中的应用。许多学者通过引入并行计算来提升张量分解算法的计算效率。在现有研究的基础上,给出一种简化计算Khatri-Rao乘积的GPU并行CP张量分解算法,称为ParSCP-ALS。在模拟数据集和真实数据集上的实验结果显示, 相比现有并行算法,文中设计的ParSCP-ALS算法能有效提高CP张量分解的计算效率,其中在Movielens数据集上 的计算时间减少了约58%。 相似文献
4.
基于CUDA架构在GPU上实现了神经网络前向传播算法,该算法利用神经网络各层内神经元计算的并行性,每层使用一个Kernel函数来并行计算该层神经元的值,每个Kernel函数都根据神经网络的特性和CUDA架构的特点进行优化。实验表明,该算法比普通的CPU上的算法快了约7倍。研究结果对于提高神经网络的运算速度以及CUDA的适用场合都有参考价值。 相似文献
5.
对于使用支持NVIDACUDA程序设计模型的GPU的二维一层浅水系统,给出了如何加速平衡性良好的有限体积模式的数值解,同时给出并实现了在单双浮点精度下使用CUDA模型利用潜在数据并行的算法。数值实验表明,CUDA体系结构的求解程序比CPU并行实现求解程序高效。 相似文献
6.
7.
8.
一种适合于GPU计算的并行后缀数组构造算法 总被引:1,自引:0,他引:1
后缀数组广泛应用于序列分析、字符串匹配和文本压缩,近年来,有关后缀数组构造和应用算法的不断探索构成了计算机科学中一个非常活跃的研究领域.在对现有串行算法进行了分析和对比之后,提出了一种新的、简洁的适合于GPU计算的并行后缀数组倍增构造算法,以排序方法替代传统的分组策略,不但能独立完成后缀数组的并行构造,还可与现存的串行倍增算法结合使用,以达到最高的执行效率.实验结果表明该算法在解决实际应用问题时,具有易于实现、执行速度快和可扩展性强等优点,尤其在处理小字符集的数据时效率更高. 相似文献
9.
10.
野外采集的地震勘探原始记录中通常包含多种噪声。噪声的存在降低了地震资料的信噪比,影响地震资料处理成果品质,因此,去噪方法研究和应用是处理工作的重要环节之一。"加权中值滤波自动检测并压制强能量干扰方法"是一种在准噶尔盆地油气勘探中非常有效的噪声压制方法。该方法在地震数据原始记录频率域剖面上采用加权中值滤波的方法自动检测可能存在的强能量干扰,并针对性地对相应频段上的噪声信号进行压制,去噪效果较为理想。但该方法的算法运行过程中涉及大量的数据计算,开发的程序需要花费大量时间才能完成一次去噪过程。提高计算效率成为该噪声压制方法推广应用的关键。高质量图像处理用途的高端图形处理器(GPU)在大规模高带宽计算方面表现出色,近年来更多地应用于高性能计算工作。CUDA并行计算开发平台帮助应用人员开发高效率计算程序,使GPU能更容易应用于高性能计算。通过分析"加权中值滤波自动检测并压制强能量干扰方法"算法实现方式,发现该算法适宜利用GPU进行并行化改造。利用CUDA并行编程技术将该算法中部分串行执行的数据计算过程改造成适合GPU计算的并行计算过程,使整个去噪方法工作效率提升3倍。GPU并行计算技术能使油气勘探数据处理过程中类似应用有效并行化,利用较小成本实现高效计算效率。 相似文献
11.
12.
13.
随着对安全攸关实时系统功能与非功能要求的日益增加,使用多核技术将成为发展趋势.如何在多核平台条件下保证系统运行的可信任性及可靠性是学术上和应用上的关键问题.目前基于形式化方法的系统设计、验证以及自动代码生成已经在单核平台上形成很多研究成果,但在多核平台上的研究仍面临许多科学问题.同步语言SIGNAL是一种被广泛应用于安全攸关实时系统功能设计的形式化方法,适用于对系统确定性并发行为的描述.SIGNAL编译器也支持将同步规范SynchronousSpecification)生成仿真代码,以对其进行验证与分析.然而现有研究较少关注从SIGNAL同步规范到支持跨平台并行代码的生成方法.本文研究面向SIGNAL同步规范的并行自动代码生成方法.提出了方程依赖图EDG的概念,将SIGNAL规范转换为EDG以分析其全局数据依赖关系;研究了对EDG进行任务划分获取规范中可以并行执行部分的算法;最后,以跨平台并行编程API-OpenMP作为对象,结合程序中信号的时钟关系,将并行任务映射到OpenMP并行代码,并进行了实例验证. 相似文献
14.
网格计算的应用的快速开发问题是制约网格技术普遍使用的关键问题之一,GBuilder是笔者自行研制的网格计算快速开发工具。该文讨论了GBuilder中代码生成技术。首先介绍了各种代码生成技术,然后给出了GBuilder中代码生成体系结构的详细描述,最后给出了一个基于模板的代码生成的实例。 相似文献
15.
本文基于软件重用和软件自动化的思想提出了支持软件重用的摸板化技术TTSSR。在TTSSR中,我们引入了软件模板的概念和可重用软件预处理的方法。使得可重用软件能按照用户需求自动进行修改,生成多种可用软件。同时,在模板库管理方面采用了一种适合大型库管理的类图书管理方法,提供了较强的库导航能力,极大地方便了用户。另外,TTSSR工具提供集成界面、用户界面两种和外界的接口,这使得它具有较强的适应性和良好的灵活性。 相似文献
16.
17.
18.
19.
20.
Fons van Hees Aad J. van der Steen Peter Jan van Leeuwen 《Concurrency and Computation》2003,15(13):1191-1204
In this paper we describe the development of a program that aims at achieving the optimal integration of observed data in an oceanographic model describing the water transport phenomena in the Agulhas area at the tip of South Africa. Two parallel implementations, MPI and OpenMP, are described and experiments with respect to speed and scalability on a Compaq AlphaServer SC and an SGI Origin3000 are reported. Copyright © 2003 John Wiley & Sons, Ltd. 相似文献