首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 80 毫秒
1.
为满足大规模线性方程组对内存容量的要求,针对对称方程组提出一种高斯消去的并行化方案。对称方程组在高斯消去过程中其子方阵的对称性仍然存在,因此在并行计算时只读入和计算三角部分的数据,从而减少储存空间的大小,提高并行效率。测试表明,该方案的并行效率优于传统算法,可应用于对称方程组的大规模数值计算中。  相似文献   

2.
ABEEMσπ(Atom BondElectronegativityEqualizationσπModel)模型中,原串行程序求静电相互作用能的方法非常耗时,致使研究问题的效率降低.针对原程序中多个循环相互嵌套的求解部分,采用带状卷帘存储迭代分配的MPI(MessagePassingInter face)并行化处理;对体系中所有原子、σ键、孤对电子、π键位点之间的静电相互作用能采用多线程CUDA(ComputerUnifiedDevice Architecture)并行化处理.传统MPI+CUDA环境中,GPU和CPU之间的数据传输开销大,导致整体性能下降以及各种粒子间计算串行调用CUDA,致使时间浪费.针对上述情况,使用GPU核心的缓存机制解决传输开销大的问题,并利用多CUDA流技术实现多个循环异步进行计算,从而缩短了运行时间.然后选取多个不同类型的大分子体系进行测试,结果表明,利用改进的MPI+CUDA并行模型进行动力学模拟,并行加速比显著提高,大幅度缩减了求解静电相互作用能的时间,并得到与串行一致的结果.  相似文献   

3.
祝永志  王国仁 《计算机工程》2006,32(11):242-244
由高档微机或RISC工作站通过高速局域网连接呵成的集群系统的实现,使高性能计算机从研究与应用领域走进普通领域。该文介绍了如何在Linux操作系统下基于分布式存储结构构造一个由普通微机组成的Beowulf并行计算系统的方法。通过编制的并行计算算法对该Beowulf系统进行了并行效率的实际测试,测试结果表明该Beowulf系统具有很高的并行计算效率和并行加速比。  相似文献   

4.
刘成军 《软件》2013,(1):119-120
在传统的线性方程组高斯消元法中需要的时间复杂度,因此在实际工程中,一个高阶的线性方程组的求解可能需要数天甚至数月的时间来求解。为了进一步提高高阶线性方程组的求解效率,本文在基于消息传递接口的并行环境下,对线性方程组的连续高斯消元算法的设计与实现进行了研究,研究的结果表明相较于传统高斯消元法,并行环境下的高斯消元解法具有更好的性能。  相似文献   

5.
基于分布式集群的线性方程组求解   总被引:1,自引:0,他引:1  
在很多应用领域中都需要求解大规模的线性方程组,然而由于单机和多处理器系统的计算能力有限,这个问题没有得到很好地解决。该文提出了一种求解这类方程组的并行算法及其在Linux集群上的实现。在介绍了该算法的矩阵分块、通信机制和改进的高斯消元法之后,描述了该算法的实现流程,并进一步对其通信开销、计算开销和存储需求进行了分析。  相似文献   

6.
高斯消去法,又称高斯消元法,实际上就是我们俗称的加减消元法。数学上,高斯消去法或称高斯-约当消去法,由高斯和约当得名(很多人将高斯消去作为完整的高斯-约当消去的前半部分),它是线性代数中的一个算法,用于决定线性方程组的解,决定矩阵的秩,以及决定可逆方矩阵的逆。当用于一个矩阵时,高斯消去产生行消去梯形形式。用高斯消去法求解线性方程组的解是一种比较常见的解线性方程组的方法,这种方法尤其在利用计算机求解线性方程组时是更是常用。但大多数情况下都是用串行的算法来解方程组,该文介绍了利用高斯消去法并行求解线性方程组的方法。  相似文献   

7.
提出了应用图形处理器(GPU)加速求解线性方程组的高斯消元法,用二维四通道纹理表示系数矩阵与常数向量构成的矩阵,在该矩阵内完成归一化、消元等操作.提出了新的纹理缩减算法,该算法不要求纹理的边长是2的幂,把该纹理算法应用于高斯消元法的列主元搜索和确定主元行号.根据这些算法,使用OpenGL着色语言编程,用图形处理器实现加速求解线性方程组的高斯消元法,运算时间与基于CPU的算法比较,随着方程组未知量数量增多,基于GPU的算法具有较快的运算速度,证实图形处理器能加速线性方程组的求解.  相似文献   

8.
以二维9速模型D2Q9(LBGK)为例,针对不同集合形状的流场,研究了数据分布与通信量及并行效率之间的关系。在“自强3000”集群式超级计算机上就流场网格的不同规模、多种数据分布及通信方案进行了数值实验。测试结果表明,LBGK模型的并行效率高、可扩展性好,在数据分布方案与流场网格形状相似时,并行效率最高。该结论与理论分析相吻合。  相似文献   

9.
马华  郑阳  王新萍  韩忠东  张西学 《软件》2011,(10):44-46
针对在刻字软件中人工对汉字拆分费时费力的问题,提出一个EPS文件中矢量汉字拆分模型。该模型在分析EPS文件中矢量汉字的构成特点基础上,设计了两个类以及类中方法的算法,其中的EPS文件类的算法用来读写EPS文件、拆分汉字部件,汉字部件类的算法完成移动和绘制汉字部件等功能。模型用c#语言编程实现,结果表明模型稳定、准确、高效,大大减少了人们拆字的工作量。  相似文献   

10.
陈鹏  任波  郭振岗  王乘 《计算机工程》2008,34(9):281-282
为了提高层状地层的可视化绘制速度,结合地质探勘数据的特点,基于MPI开发地层的并行可视化程序,并采用Kriging方法对多个地层的数据进行并行插值计算。利用多台PC机搭建Windows2000 操作系统下的并行计算环境,计算时间统计数据对比表明并行计算方法能有效地节省计算时间。  相似文献   

11.
使用伪谱方法的大涡模拟准确、高效,但在高雷诺数情况下,计算量仍然非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法大涡模拟的并行计算方法。通过实例验证,该方法准确、易行、稳健,并且可以大幅提高计算速度,节省计算时间,这对大涡模拟在工程中的广泛应用具有重要意义。  相似文献   

12.
针对Voronoi图k阶邻近矢量法构建复杂发生元困难,栅格法耗时长、精度受限等问题,提出了一种基于矩阵迭代的并行计算方法。以刀片机作为并行计算的硬件平台,采用Arcgis软件将MapInfo格式矢量数据转换为栅格数据,实现了MPI并行环境中Voronoi图k阶邻近的栅格计算新方法。实验结果表明,改进后的Voronoi图k阶邻近栅格并行算法明显地提高了计算效率,且在栅格Voronoi图精度较高时,运行时间的拐点后移,加速比提高。  相似文献   

13.
在使用Linux构建的工作站集群环境下,对支持并行编程的C函数库P4(Portable Programs for Parallel Processors)的初始化过程进行了研究,重点剖析了进程创建和通信建立这两个部分,并对源代码中涉及到的主要数据结构及其使用给出了详尽的分析说明。对研究和开发并行编程工具有一定的参考价值。  相似文献   

14.
当前主流GIS软件以及互联网地图应用在WebGIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在WebGIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化方面的不足,提出一种名为ParaTile的高效栅格影像快速瓦片化方法,ParaTile基于MPI共享外存的并行技术,利用多进程对原始栅格影像进行数据划分,每个进程对其所划分的区域进行独立读写和计算,而后再按照TMS或者Google Tile定义的标准将瓦片进行编码输出。实验采用不同级别大小的遥感影像进行测试,结果表明ParaTile在面对不同规模的数据时,无论从速度还是算法稳定性上都较现有算法和工具具有显著优势,特别是当数据量越大时,这种优势愈加明显。  相似文献   

15.
使用伪谱方法的直接数值模拟准确、高效,但在高雷诺数情况下,计算量非常巨大,需要采用并行方法,但是快速傅里叶变换的并行算法在实际应用中有很大的困难。针对这一问题,提出了一种新的基于MPI的伪谱法直接数值模拟的并行计算方法。通过实例验证,该方法准确、易行、稳健,并且可以大幅提高计算速度,节省计算时间,这对直接模拟在科学研究和工程实际中的广泛应用都具有重要意义。  相似文献   

16.
在分布式存储结构的机群系统上,采用可移植消息传递接口MPI与C语言绑定,设计并实现了并行蒙特卡罗算法.有效解决了计算量大、串行算法执行时间长的问题。通过对机群节点间通信时间开销的研究分析.采用主从式编程模型改进并行蒙特卡罗算法,实现了负载平衡,提高了机群处理器的利用率,进一步缩短了执行时间。  相似文献   

17.
周鋆  朱承  张维明  黄金才  刘忠 《计算机工程》2011,37(5):261-263,266
复杂地形环境下的电磁覆盖范围的仿真计算需要强大的计算能力作为支撑,搭建基于消息传递接口的机群实行并行计算能够解决该问题。基于此,建立复杂地形环境下电磁覆盖范围的并行算法模型,设计并行过程中任务粒度选择和并行性能实验。在实验室多机环境下,仿真计算速度得到提高,为类似并行计算问题的任务粒度选择提供了参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号