首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
整体异步的并行转换算法   总被引:1,自引:0,他引:1       下载免费PDF全文
黄利国  孙莉  韩丛英 《计算机工程》2008,34(21):54-55,5
针对Fukushima提出的求解无约束最优化问题的同步并行转换算法(PVT),提出一个整体异步并行算法,该算法去除了并行计算中同步与通信的开支。在一定的条件下,证明了该算法具有全局收敛性以及线性收敛速度。数值试验结果表明,异步PVT算法优于同步PVT算法。  相似文献   

2.
曾维彪  蔡自兴 《计算机工程》2008,34(21):193-195,
针对Fukushima提出的求解无约束最优化问题的同步并行转换算法(PVT),提出一个整体异步并行算法,该算法去除了并行计算中同步与通信的开支.在一定的条件下,证明,该算法具有全局收敛性以及线性收敛速度.数值试验结果表明,异步PVT算法优于同步PVT算法.  相似文献   

3.
并行蚁群算法中的自适应交流策略   总被引:6,自引:0,他引:6  
陈崚  章春芳 《软件学报》2007,18(3):617-624
提出了并行蚁群算法中处理机间信息交流的两种策略,使得各处理机能够自适应地选择其他处理机以进行信息交换和相应信息素的全局更新.还提出了一种确定处理机之间进行信息交流的时间的策略,可以根据解的分布情况自适应地确定信息交流的时间,以取得全局收敛速度和解的多样性之间的平衡.在算法每一次信息交换后,采用自适应的更新策略,根据信息素的均匀度进行信息素的更新,从而避免了早熟和局部收敛.在MPP处理机曙光2000上对TSP问题的实验结果,表明了基于该自适应信息交换策略的并行蚁群算法比其他算法具有更好的收敛性、更高的加速比  相似文献   

4.
求解复杂函数优化问题的混合蛙跳算法*   总被引:12,自引:3,他引:12  
针对基本混合蛙跳算法在处理复杂函数优化问题时容易陷入局部最优、收敛速度慢的缺点,提出了一种改进的混合蛙跳算法。该算法把生物学中的吸引排斥思想引入到混合蛙跳算法中,修正了其更新策略,从而维持了子群的多样性。实验仿真结果表明,改进的混合蛙跳算法提高了算法的收敛速度,有效地避免了SFLA的早熟收敛问题,从而改善了对复杂问题的搜索效率,数值实验结果验证了算法的有效性和鲁棒性。  相似文献   

5.
基于多处理机的混合实时任务容错调度   总被引:13,自引:1,他引:13  
阳春华  桂卫华  计莉 《计算机学报》2003,26(11):1479-1486
提出了一种混合实时任务容错调度算法.该算法采用Rate Monotonic(RM)算法完成周期任务的静态调度;采用预订处理机时间方法和Earlier Deadline First(EDF)算法动态调度非周期任务;采用主/副版本备份技术确保系统的容错能力.通过充分利用周期任务的剩余处理机时间调度非周期任务和主动备份与被动备份相结合的方法有效地减少了处理机数.仿真结果证明了算法的有效性.  相似文献   

6.
何小虎 《福建电脑》2013,29(7):18-19
为了解决普通蚁群算法容易产生的停滞和收敛速度慢等问题,提出了一种改进的蚁群算法,通过改变信息素的更新策略和状态转移规则,实验结果证明改进的蚁群算法可以有效解决普通蚁群算法容易陷入局部最优解和收敛速度慢等现象。  相似文献   

7.
具备可重配置流水线总线的线性阵列LARPBS(1inear arrays with a reconfigurable pipelined bus systems)是近来出现的一种高效的并行计算模型.与理想的PRAM模型不同.LARPBS是现实可行的。基于LARPBS模型,Y.Pan介绍了2种宽度和精度任意的数据项的最大值查找算法:算法1使用了N^2/2个处理机、O(1)时间,它是目前时间最优的算法;算法2使用了N个处理机、O(loglogN)时间。本文介绍了2种最大值查找算法.时间复杂度同Y.Pan的算法,但所用处理机数减少了一半.这是对Y.Pan算法的重要改进。  相似文献   

8.
本文针对小波网络现有学习算法的不足,把Levenberg-Marquardt算法(简称LM算法)和最小二乘算法有机地结合在一起,提出了一种新的小波网络混合学习算法.在该混合算法中LM算法用来训练小波网络的非线性参数,而最小二乘算法用来训练线性参数.最后以辩识一个混沌系统为例进行了数值仿真,并与改进的BP算法和单纯LM算法进行了比较,结果说明了所提算法具有很好的收敛性能和收敛速度.  相似文献   

9.
基于混沌变异的小生境粒子群算法   总被引:17,自引:0,他引:17       下载免费PDF全文
针对粒子群算法早熟收敛和搜索精度低的问题,提出了基于混沌变异的小生境粒子群算法(NCPSO).该算法结合小生境技术并加入了淘汰机制,使算法具有良好的全局寻优能力.变尺度混沌变异具有精细的局部遍历搜索性能·使算法具有较高的搜索精度.实验结果表明,NCPSO算法可有效避免标准PSO算法的早熟收敛,具有寻优能力强、搜索精度高、稳定性好等优点.适合于工程应用中的复杂函数优化问题.  相似文献   

10.
针对粒子群算法后期收敛速度慢、易陷入局部极值的缺点,提出一种基于粒密度和最大距离积法的简 化粒子群聚类算法.通过采用线性递减与随机分布相结合的惯性权重策略、添加极值扰动算子、优化粒子个体最优位置,使粒子群算法能够快速收敛于全局最优.再把改进后的粒子群算法与K-means算法相结合,解决K-means算法因随机初始聚类中心而导致聚类效果差、不稳定等问题.通过实验分析,该算法的聚类结果准确率更高、收敛速度更快、稳定性更强.  相似文献   

11.
针对大规模边界约束优化问题,现有并行变量转换(PVT)算法不适于直接求解。基于此,采用内点法和逐步下降的思想,提出一个并行求解边界约束最优化问题的可行算法。在下降方向满足梯度相关、步长满足Goldstein规则的条件下,证明该算法的收敛性。当约束失效时,该算法退化为求解无约束的PVT算法,从而成为原有算法向约束优化问题的一个推广。  相似文献   

12.
快速小波变换在DSP中的实现方法   总被引:6,自引:0,他引:6  
小波分析是分析非稳定信号的一种非常有泖的方法。Mallat快速算法使得小波分析的广泛应用成为现实。在实时信号分析中,离散小波变换在DSP上的有效应用受到了特别的关注。本文简单介绍了FWT,详细阐述了在DSP上FWT的周期性扩展的实现。其中,特别介绍了DSP的循环寻址。最后,给出了针对TI公司的TMS320C3X系列DSP的相应的江编代码。  相似文献   

13.
为了解决优先级调度算法的可扩展性问题,本文设计并实现了一种局部的深度优先扫描算法(PDFHDS)。该算法在计算初始优先级和计算最终优先级时,对每个结点只遍历一次,在这一次遍历中只访问该结点的全部直接前驱,避免了在PDFDS算法中每修改一个结点的优先级就要访问其全部前驱结点的情况,减少了一部分计算开销,消息传递过程使用单向传递,只向前邻处理器传递有多级外部后继的网格点信息,而不传递只具有一级外部后继的网格点信息,节省了通信开销。从实验数据可知,虽然在处理器个数少的时候性能比不上DFHDS算法,但对于多处理器的情况,PDFDS算法的性能可以比DFHDS算法的提高50%,甚至更多。  相似文献   

14.
The approximation ratio of the longest processing time (LPT) scheduling algorithm has been investigated in various studies. While the tight approximation ratio is known for the cases when all processors are identical, the ratio is unknown when the processors have different speeds. In this study, we provide a tight approximation ratio for three, four, and five processors. We show that the ratios for these cases are no larger than the lower bound provided by Gonzalez et al. (1977) [14]. The ratios are approximately 1.38, 1.43, and 1.46 for three, four, and five processors, respectively.  相似文献   

15.
连接是数据查询处理中最耗时、使用最频繁的操作之一,对提高连接操作的速率具有重要意义。阵列众核处理器是一类重要的众核处理器,具有强大的并行能力,可用来加速并行计算。基于阵列众核处理器的结构,设计和优化了一种高效的多层分区Hash连接算法。该算法通过多层划分的策略大大降低了主存访问次数,通过分区重排方法有效消除了数据倾斜的影响,获得了很高的性能。在异构融合阵列众核处理器DFMC(Deeply-Fused Many Core)原型系统上的实验结果表明,DFMC上多层分区Hash连接算法的性能是CPU-GPU耦合结构上最快的连接算法的8.0倍,表明利用阵列众核处理器加速数据查询应用具有优势。  相似文献   

16.
多簇超长指令字处理器的簇间数据传输会将导致处理器性能下降。该文针对寄存器堆互连的多簇超长指令字(RFCC-VLIW)结构,提出一种新的二维力量引导调度算法,其力量表达式为以周期和簇为自变量的二维力量。实验结果表明,以RFCC-VLIW结构为目标,该二维力量引导调度算法优于现有的其他多簇超长指令字处理器的调度算法。  相似文献   

17.
1IntroductionAlgorithmshavebeenproposedtosolvelinearrecurrencesinparallell1-13].Someofthemsupposeunlimitednumberofprocessorsbeingusedwhileothersuselimitednumberofprocessors.P-M.KoggeandH.S.Stoneproposedarecursivedou-blingalgorithmforthesolutionofageneraJclassofrecuxrenceequationsl1].Itisthefastestalgorithm(thetimeisO(log,N))whenthenumberofprocessingelemelltspiseqllaltoN.Howeveritisnotoptimalintermsofefficiency:itsspeedupisO(de),whileitsefficiencyisO(wt).TherecursivedoublingapproachcanPro…  相似文献   

18.
以脉动式阵列(Systolic)应用研究为背景,分析了离散傅立叶变换(DFT)经典并行算法及其在阵列机上的特点;并针对该算法在处理机上并行实现的弱点,提出了在并行处理环境下适合大规模DFT的方体向量法。这种方法不需要在处理机之间进行数据转置,减少了处理之间的通信以及运算数据之间的依赖性,使变换能够在较大程度上异步进行,并摆脱了在操作数规模上的制约。文章还给出了在Systolic阵列上由方体向量法实现的三维DFT的具体例子。  相似文献   

19.
A linear scaling parallel clustering algorithm implementation and its application to very large datasets for cluster analysis is reported. WaveCluster is a novel clustering approach based on wavelet transforms. Despite this approach has an ability to detect clusters of arbitrary shapes in an efficient way, it requires considerable amount of time to collect results for large sizes of multi-dimensional datasets. We propose the parallel implementation of the WaveCluster algorithm based on the message passing model for a distributed-memory multiprocessor system. In the proposed method, communication among processors and memory requirements are kept at minimum to achieve high efficiency. We have conducted the experiments on a dense dataset and a sparse dataset to measure the algorithm behavior appropriately. Our results obtained from performed experiments demonstrate that developed parallel WaveCluster algorithm exposes high speedup and scales linearly with the increasing number of processors.  相似文献   

20.
针对基于PVM的由桌面PC机联网而成的网络并行计算环境中,处理机的运算速度较快而处理机间的通信相对较慢的实际情况,给出了一种局域网求解三角形方程组的并行算法,该算法将三角形方程组的系数矩阵及右端项按行分块,然后将分块的系数矩阵及右端项按卷帘方式存储在各处理机,通过循环传送已求出的解的部分分量以减少处理机间的通信开销,实现较容易。并在1-4台桌面PC机联成的局域网,PVM 3.4 on Windows 2000,VC 6.0并行计算平台上编程对该算法进行了数值试验,试验结果表明该算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号