首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在这篇文章里,我们对Fukushima提出的关于无约束优化问题的PVT算法作了改进,提出利用PVD算法中的PVD-方向来构造的PVT-变换矩阵,得到一个更适合于异步执行的PVT算法,从而减少各处理机之间的等待时间,提高并行机的并行效率.文中证明算法具有线性收敛速度,且其线性收敛比与处理机个数无关,该结果改进了中的结果,更适合于并行计算.  相似文献   

2.
1.引言江南Ⅲ型并行机是江南计算所与中科院计算所最近协作推出的一个具有局部内存和共享主存的多机系统,它的每个处理单元由Intel公司的i860组成。目前有十个处理单元,每个处理机上有16MB的内存。该机的共享主存有64MB。从存储量上来看,是求解大规模问题的理想机器。该系统还在不断完善中。今后将增加的有FORTRAN语言的直接并行实现、进程之间的同步控制等一些方便用户的软件工具、江南见并行机结构图如由于江南见并行机是一个具有局部内存和共享主存的并行计算机,算法设计要结合这一特点,设计出适合该机执行的并行算法。我们给…  相似文献   

3.
通过改变CR算法的计算次序。提出了一种改进的共轭剩余(ICR)算法.对比CR算法。ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量。但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为CR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性。可以进行计算与通信的重叠.从理论和实验两个角度来讨论ICR算法的性能,当处理机台数较多时ICR算法的计算速度快于CR算法.在64台处理机机群上进行的数值实验表明,并行ICR算法的计算速度大约比CR算法快30%.  相似文献   

4.
文中分析了传统基于并行基准测试程序测试方法的不足,针对目前高性能计算机处理机台数多的特点,给出了实用的测试方法,推广了传统加速比的概念,提出了一种可扩展性评价方法。使用文中给出的方法,可方便地对高性能计算机进行测试和性能评价,同时可以使用小规模的并行机测试结果预测大规模并行机的性能。最后给出了NPB在某高
性能计算机上的测试和性能评价结果。  相似文献   

5.
沈亚楠  姚远  张平  赵荣彩  罗向阳 《计算机工程》2006,32(11):114-115,132
数据分解对消息传递并行机下的并行编译器取得高性能至关重要。根据编译器自动得出的数据分解(映射数据到处理机)信息,C语言版本的发送/接收消息循环嵌套可产生出来,从而在处理机之间实现分布数据。不仅一个已被证明且功能强大的数学模型用于产生数据分解代码,而且一个形式化的算法及其实现也已给出。初步实验结果显示该算法能显著提高性能。  相似文献   

6.
本文讨论产生并行随机数的乘同余法递推公式及并行随机数检验方法。在Transputer并行机上模拟并行随机数产生及检验,其结果令人满意。同时给出二个处理机统计模拟试验的例子,其加速比接近于2。  相似文献   

7.
本文讨论产生并行随机数的乘同余法递推公式及并行随机数检验方法。在Transputer并行机上模拟并行随机数产生及检验,其结果令人满意。同时给出二个处理机统计模拟试验的例子,其加速比接近于2。  相似文献   

8.
基于Markov Chain Monte Carlo(MCMC),思想的Gibbs仿真算法的引入使得大型因果图模型的推理速度得到极大提高,而利用节点间相互独立的特性,可以对其进行并行的采样,从而进一步加快推理速度。该文通过分析Gibbs算法,提出了将整个推理运算过程映射到多处理机系统中的判定准则,防止了机械地对处理机进行分配而造成的计算资源的浪费,算法能够根据实际处理机的数目以及不同的计算能力而灵活地分配计算资源,更加有利于发挥并行机的计算能力。通过仿真实验,验证了计算模型的有效性。  相似文献   

9.
TFQMR算法是一种Krylov子空间算法,常用来求解大型稀疏线性方程组.通过改变TFQMR算法的计算次序,提出了一种改进的TFQMR(ITFQMR)算法.对比TFQMR算法,ITFQMR算法的数值稳定性和TFQMR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为TFQMR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ITFQMR算法的性能,当处理机台数较多时,ITFQMR算法的计算速度快于TFQMR算法.实验说明了在有64台处理机机群上进行,最快的并行ITFQMR算法的计算速度大约比TFQMR算法快20%.  相似文献   

10.
解K阶线性递归N方程组的一种实用并行算法   总被引:1,自引:0,他引:1  
本文提出了解K阶线性递归N方程组的一种实用并行算法.当K相似文献   

11.
静态负载平衡问题的表示与算法   总被引:3,自引:1,他引:3  
对工程与科学计算中的若千数值分析问题,其并行算法已经开展了较为广泛的研究,如线性代数问题的并行求解等,但是目前在这些数值并行算法中,对于特定的并行机体系结构,怎样进行任务划分与处理机分配以求获得较高的并行效率,或者是没  相似文献   

12.
本文研究有n个作业需在5个处理机中心进行加工,处理机中心i由l1个恒速机组成的非抢占式多机flow shop调度最小和问题.每个作业有s个工序,每个工序需在对应的处理机中心的任一台机器上加工处理,作业到达前不能加工,所有作业通过处理机中心的路径相同.目标是确定一个作业在每个处理机中心机器上的可行调度序列,使所有作业在最后处理机中心的加权完成时间总和最小化.在作业处理时间需求、作业权重分别为独立同分布的有界随机变量时,通过特殊flow shop调度松弛方法,我们证明该问题在作业数趋于无穷时,一个基于有效作业最短加权平均处理时间需求的启发式算法是渐近最优的.  相似文献   

13.
1引言在并行计算中,仟务划分与处理机分配带来的负载平衡问题是并行计算的一个基本问题,直接影响到并行效率和加速比。一般来讲,负载平衡就是要尽量均匀地分配任务,并尽量减少节点机之间的通信;然而根据并行机体系结构与并行应用程序的不同,解决问题的方法也相应地不同。静态问题一般是  相似文献   

14.
许多并行计算问题,在结合并行机的特有体系结构时,要对算法的并行性能及其可扩展性进行分析。它决定了该算法解决有关问题是否有效,并进一步判断所用的并行计算系统是否符合求解问题的要求。文章通过对Krylov子空间中两种有效算法-PCG算法和GMRES(m)算法在一类并行系统中形成的并行算法的性能进行了分析,给出了其求解问题规模与处理机数与加速比的关系结果表明。GMRES(m)算法比PCG算法更适合于并行。  相似文献   

15.
本文根据影响并行蚁群算法性能的关键因素,提出了一种自适应的并行蚁群算法.首先提出了基于适应度和基于距离选择的两种不同的信息交流策略,使得各处理机自适应地选择与之进行信息交换的处理机,然后采用自适应的更新策略进行信息素的更新.为了增强该算法的搜索能力,还根据解的多样性给出了自适应地调节处理机之间的信息交流周期的方法.在MPP处理机深腾1800上对TSP问题的实验结果表明了该算法在保证有效的加速比的同时,具有很好的收敛性.  相似文献   

16.
何谓Millicode?Microcode(激码),Nanocode毫微码).现在又冒出Mil!icode(毫码),这些码究竟是什么?Microcode是一个在片程序,其功能是翻译各种处理机指令,控制该处理机逻辑中的某些部分以执行所要求的活动。因此,...  相似文献   

17.
在采用local cache,write-inval:date cache一致性协议的多级存储并行处理系统中,一个经常出现的现象就是真假共享所引起的Cache行抖动,由于这种数据在不同处理机的Cache间来回移动的现象严重地影响了并行机性能的发挥,它已受到计算机界广泛的关注,如何使这一问题得到简单而有效的解决已成为多级存储并行处理系统研究的一个关键,为了消除真共享引起的抖动现象,我们已经提出了一套  相似文献   

18.
随着超级计算机向着更大规模趋势发展,并行算法与并行机相结合的可扩展性日益得到重视,特别是对实际应用程序的可扩展性研究愈为迫切.新的并行机的发展己成为科学计算本身的一个巨大挑战.目前仍然缺乏能求解“巨大挑战性问题”的数值方法和并行度高、可扩展性好的应用软件.大规模并行计算的一个关键问题是可扩展性问题[1].不可能期望通过将串行代码移植到并行系统上就能获得很大的性能增益.当处理机节点数超过64,16甚至8时,这种做法将使可扩展性降低.我国目前仍局限于中小型计算,原有算法和并行软件是否能求解更大规模问题是个值得关注的问题.  相似文献   

19.
基于PVM的线性方程组的一种网上并行迭代算法   总被引:1,自引:0,他引:1  
针对基于PVM的桌面PC机联网而成的网络并行计算环境中,处理机的运算速度较快,而处理机间的通信相对较慢的实际情况,提出了求解线性方程组的一种分组Guass-Seidel并行迭代算法,该算法将线性方程组的增广矩阵按行分块储存在各处理机,每台处理机分别对各自的块采用Guass-Seidel迭代法进行迭代计算,其处理机间的通信较少,实现容易。并用1~24台桌面PC机联成的局域网,在PVM 3.4 on Windows2000,VC 6.0并行计算平台上编程对该算法进行了数值试验,试验结果表明,该算法较传统的Jacobi并行迭代算法和传统的Guass—Seidel并行迭代算法更优越。  相似文献   

20.
95027更实际的并行计算模型小型微型计算机系统。-1995(2).—1~9介绍了几个能反映近代并行机性能的更为实际的并行计算模型,包括异步PRAM、BSPlogP及c ̄3模型等。虽然这些模型在与真实并行机吻合的程度,可使用性和分析较复杂算法时的可操...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号