首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
具有病态规模的嵌套循环程序在进行循环分块时容易忽略分块因子对向量化的影响,导致非对齐数据访问,降低分块后循环代码的性能。提出了一种向量化友好的循环分块因子选择算法VEC-TSS。该算法对可向量化循环层以向量化收益分析确定分块因子,对其他循环层通过以局部性收益和并行粒度确定分块因子。实验结果表明,针对具有病态规模的循环程序,VEC-TSS算法与另外两种分块因子选择算法相比可以获得更好的程序加速比,同时具有良好的可扩展性。  相似文献   

2.
Stencil计算是科学应用中的一类重要计算,而分块是提升Stencil计算数据局部性的关键技术。针对现有三维Stencil优化在SW26010处理器上缺少时间分块以及分块参数需手工调优的问题,引入时间分块,提出了面向SW26010处理器的三维Stencil自适应分块参数算法。通过建立性能分析模型,结合硬件计算能力及存储容量等限制因素,文中系统地分析了分块参数对模型性能的影响,判断性能瓶颈,指导分块参数的优化方向。基于性能分析模型,自适应分块参数算法可给出预测性能最优时的分块参数,有利于三维Stencil在SW26010处理器上的快速优化部署。选取了三维7点和三维27点Stencil算例进行实验。与未使用时间分块的三维Stencil优化相比,以上两个算例在自适应选择的分块参数下可以达到1.47和1.29的加速比,且实际最优分块参数与理论最佳分块参数一致,这验证了所提性能分析模型及自适应分块参数算法的有效性。  相似文献   

3.
基于机器学习的迭代编译方法可以在对新程序进行迭代编译时,有效预测新程序的最佳优化参数组合。现有方法在模型训练过程中存在优化参数组合搜索效率较低、程序特征表示不恰当、预测精度不高的问题。因此,基于机器学习的迭代编译方法是当前迭代编译领域内的一个研究热点,其研究挑战在于学习算法选择、优化参数搜索以及程序特征表示等问题。基于监督学习技术,提出了一种程序优化参数预测方法。该方法首先通过约束多目标粒子群算法对优化参数空间进行搜索,找到样本函数的最佳优化参数;然后,通过动静结合的程序特征表示技术,对函数特征进行抽取;最后,通过由函数特征和优化参数形成的样本构建监督学习模型,对新程序的优化参数进行预测。分别采用k近邻法和softmax回归建立统计模型,实验结果表明,新方法在NPB测试集和大型科学计算程序上实现了较好的预测性能。  相似文献   

4.
刘勇  陆林生  何王全 《软件学报》2010,21(Z1):290-297
考虑到硬件管理Cache 多级存储结构在功耗和面积方面的开销过大,众核处理器倾向于采用软件管理的多级存储结构,这就需要软件规划好程序的数据在各级存储上的布局和传输.尝试了一种依赖程序原有循环结构和问题规模的简易数据自动分块方法,根据循环层内的数据访存范围进行相应的分块,避免数据复杂的依赖关系分析,使得该方法易于在编译器中实现.同时可根据需要进一步结合程序变换如循环交换、循环联合和循环分裂等方法得到更佳的分块参数.实验结果表明,在大多数问题规模下与一般分块方法的优化性能相当,但在某些特定问题规模下能够获得较高的优化性能.  相似文献   

5.
蚁群算法参数优化   总被引:8,自引:2,他引:8  
针对蚁群算法运行参数选取问题,提出一种利用粒子群优化算法对蚁群算法的运行参数进行优化选择的方法。将蚁群算法的运行参数作为粒子群的位置信息,在算法迭代过程中使用粒子的当前位置作为算法参数,运行蚁群算法求解标准优化问题,设计适应值评价函数对求解性能做出评价,引导粒子向着适应值高的方向趋近。仿真结果表明,该算法能够方便有效地实现对蚁群算法运行参数的优化选取。  相似文献   

6.
机器学习的性能受特征选择和参数优化的影响很大,针对这一问题,采用基于蚁群算法和遗传算法的混合算法对特征选择和参数优化问题进行了探究。实验结果表明,该混合算法相比单个的蚁群算法或遗传算法,在特征选择和参数优化方面,具有更高的准确率。  相似文献   

7.
存储墙是影响单机性能优化的重要因素,其缓解依赖于对程序进行存储优化。论文提出基于经验搜索的多级存储层次优化方法,将优化多级存储层次问题转化为对优化参数的经验搜索问题,并基于遗传算法选择全局最优解。实验表明,该技术可以自适应不同应用程序,大大降低存储访问时间,降低存储因素对程序性能的影响,从而有效地缓解存储墙问题。  相似文献   

8.
循环分块是一种广泛用于改善数据局部性和开发并行性的程序变换优化技术.主要分为2类:固定分块技术和参数化分块技术,系统地总结了这2类技术,并分析了其优缺点.由于分块大小的选择会严重影响分块代码的性能,因此介绍分析了选择最优分块大小的各种方法.此外,总结了循环分块在多级分块、并行性开发和不完美嵌套循环等方面应用的各项技术.通过对循环分块技术当前研究现状的分析,得出如下结论:1)循环分块技术中的计算复杂度和生成代码效率问题还未得到完全解决,如何利用循环边界有效地约束迭代空间并提高数据局部性还需要更深入的研究;2)最优分块大小的选择依然是一个开放式难题,研究清楚分级存储架构中每级分块对性能的影响具有重要的意义;3)从循环分块的应用角度,如何有效地构建面向任意嵌套循环集的自动分块代码生成系统,同时充分利用深度共享存储资源和多核架构实现分块代码的高并行度,也是一个需要深入研究的问题.  相似文献   

9.
支持向量机的参数选择仍未有系统的理论指导,其优化选择一直是支持向量机的一个重要研究方向。考虑到人工鱼群算法优化支持向量机参数往往易陷入最优参数组合微小邻域的问题,构造了用于支持向量机参数优化的AFMC算法。该算法前期利用鱼群算法较好的并行寻优性能,能快速寻得问题的近似最优解,而后利用MonteCarlo法进行局部寻优,以实现快速、有效地获取强近优解。数值实验结果表明,该算法具有较好的分类性能和较快的寻优速度,验证了在支持向量机参数寻优中的有效性和可行性。  相似文献   

10.
基于OpenBLAS和BLIS开源线性代数基础算法库,对稠密矩阵乘法GEMM运算的性能优化展开研究。针对如何选取稠密矩阵分块并行算法的关键分块参数这一问题,建立性能优化模型。采用改进的遗传算法求解上述优化模型,将某一分块参数组合(种群个体)所对应的稠密矩阵乘法的性能值作为该个体的适应度,通过不断迭代地进行选择、交叉、变异操作,找到最优的分块参数组合,使得稠密矩阵运算的性能值最优。数值实验表明,基于遗传算法求解得出最优分块参数下的GEMM性能值优于默认分块参数下的性能值,达到了优化的目的。  相似文献   

11.
In this paper, the parametric optimization method is used to find optimal control laws for fractional systems. The proposed approach is based on the use for the fractional variational iteration method to convert the original optimal control problem into a nonlinear optimization one. The control variable is parameterized by unknown parameters to be determined, then its expression is substituted into the system state‐space model. The resulting fractional ordinary differential equations are solved by the fractional variational iteration method, which provides an approximate analytical expression of the closed‐form solution of the state equations. This solution is a function of time and the unknown parameters of the control law. By substituting this solution into the performance index, the original fractional optimal control problem reduces to a nonlinear optimization problem where the unknown parameters, introduced in the parameterization procedure, are the optimization variables. To solve the nonlinear optimization problem and find the optimal values of the control parameters, the Alienor global optimization method is used to achieve the global optimal values of the control law parameters. The proposed approach is illustrated by two application examples taken from the literature.  相似文献   

12.
田家强  陈勇  张建照 《计算机科学》2018,45(3):98-101, 137
在基于认知无线电的动态频谱管理中,频谱感知需要发现更多的频谱机会,同时尽量减少对授权用户的干扰。文中研究了能量感知中这两个性能指标的折中优化问题,建立了以两个指标的加权作为优化目标函数、感知时间和感知门限作为优化变量的联合优化模型,并证明了该问题属于双凹优化问题。提出了基于迭代凸优化搜索的优化算法,该算法在不依赖预置感知门限或感知时间的情况下,能够快速获得近似最优解。仿真表明, 相比于单参数优化方法,所提联合优化算法 的性能平均提高了32%和85.9%。  相似文献   

13.
This paper describes an innovative optimization approach that offers significant improvements in performance over existing methods to solve shape optimization problems. The new approach is based on two-stages which are (1) Taguchi's robust design approach to find appropriate interval levels of design parameters (2) Immune algorithm to generate optimal solutions using refined intervals from the previous stage. A benchmark test problem is first used to illustrate the effectiveness and efficiency of the approach. Finally, it is applied to the shape design optimization of a vehicle component to illustrate how the present approach can be applied for solving shape design optimization problems. The results show that the proposed approach not only can find optimal but also can obtain both better and more robust results than the existing algorithm reported recently in the literature.  相似文献   

14.
基于改进粒子群算法的Hammerstein模型辨识   总被引:2,自引:1,他引:1       下载免费PDF全文
提出辨识非线性Hammerstein模型的新方法。将非线性系统的辨识问题转化为参数空间上的函数优化问题,采用粒子群算法获得该优化问题的解。为了进一步增强粒子群优化算法的辨识性能,提出采用速度变异粒子群对整个参数空间进行搜索得到系统参数的最优估计。仿真结果验证了该方法的有效性。  相似文献   

15.
布井的数量及位置的选取是油田开发中至关重要的一环。一项最优的布井方案受到地质情况、油藏驱动方式、流体特性、油田设备规格以及多种经济参数指标的影响,是一个具有多决策变量的优化问题,传统的数学优化方法在处理这类问题时,很难找到一个合适的目标函数来满足优化条件。量子算法作为量子计算与智能算法相结合的产物,其优秀的寻优能力以及良好泛化能力,在处理目标函数性态复杂的优化问题时较传统方法有着更好的表现。因此,本文利用MATLAB建立油藏数值模拟模型,将井的数量和井位作为变量,以油田净现值为目标函数结合改进的量子遗传算法(Quantum Genetic Algorithm,QGA)对井位进行优化。通过与传统布井方式的对比,所提出的方法有更好的经济效益,同时摆脱了传统布井方式对于经验的依赖,具有很好的移植性。  相似文献   

16.
对最优控制问题的求解是实现计算机控制的前提条件,但有效地求出控制系统的全局最优解是困难的。现今各种求解此问题的算法需要增强算法的优化性能与简洁性。遗传算法求此类问题需要进行离散化;复形法、粒子群算法求解此类问题容易陷入局部极值。为此提出用带有复形法局部搜索的粒子群算法求解此类问题。此算法充分考虑粒子群算法与复形法的特性,将复形法的局部搜索与粒子群算法的全局搜索结合起来,以提高算法搜索能力,克服粒子群算法与复形法易陷局部极值的不足。通过性能测试效果良好,同时算法简便、可行、高效。最后将所提算法用于求解Park-Ramirez生物反应器补料流率的动态优化,取得了满意的效果。  相似文献   

17.
基于混沌优化算法的支持向量机参数选取方法   总被引:31,自引:0,他引:31  
袁小芳  王耀南 《控制与决策》2006,21(1):111-0113
支持向量机(SVM)的参数取值决定了其学习性能和泛化能力.对此,将SVM参数的选取看作参数的组合优化,建立组合优化的目标函数,采用变尺度混沌优化算法来搜索最优目标函数值.混沌优化算法是一种全局搜索方法,在选取SVM参数时,不必考虑模型的复杂度和变量维数.仿真表明,混沌优化算法是选取SVM参数的有效方法,应用到函数逼近时具有优良的性能.  相似文献   

18.
阴阳对优化算法是一种新颖的轻量级随机优化算法,利用两点(全局探索点P 2和局部开发点P 1)的迭代交换来实现优化搜索。用户定义参数直接影响该算法的全局探索和局部开发之间的平衡,并且对算法的性能有着重要的影响。为提高该算法的优化性能,首先分析了原算法的用户定义参数(缩放因子α)对于性能的影响,随后提出用户定义参数线性与非线性递减三种改进的阴阳对优化算法。采用2013年进化计算大会中单目标实参算法竞赛中使用的28个测试函数进行性能评估,结果表明相比于原算法,改进后的算法具有更高的计算精度和更快的收敛速度。最后通过一个工程优化任务来展示改进后算法的性能。  相似文献   

19.
提出采用在线性能评估准则和离线性能评估准则评价竞选算法用于数值优化问题时的性能。通过对标准测试函数的数值优化实验,分析竞选算法的参数对算法在线性能和离线性能的影响,为竞选算法实际应用时的参数选择提供依据。实验结果表明,通过控制参数的改变,可有效改善竞选算法的在线性能和离线性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号