首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
近似动态规划方法求解非线性系统最优控制,需要迭代无限步才能得到最优控制律.本文提出了一种ε-近似最优控制算法,选择ε误差限,通过自适应迭代不断逼近哈密顿-雅可比-贝尔曼(HJB)方程的解,应用神经网络实现在有限步迭代后得到带ε误差限的近似最优控制律.计算机仿真结果表明了该算法的有效性.  相似文献   

2.
为有效控制离散非线性系统,使系统控制策略能够应对状态域的所有初始状态,在近似动态规划方法的基础上,提出一个未固定初始状态的带ε误差限的离散非线性系统优化控制算法。研究初始状态对离散系统控制策略的影响,确定在初始状态域边界上寻找最优初始点的方法。所求控制策略使初始状态域的所有性能指标函数在最大迭代步数内收敛,使性能指标与最优性能指标保持在精度ε内。为了易于实现算法,使用神经网络来近似性能指标函数和最优控制策略。结合实例,对该算法进行仿真分析,分析结果表明了算法的有效性。  相似文献   

3.
林小峰  张衡  宋绍剑  宋春宁 《控制与决策》2011,26(10):1586-1590
为了获得非线性离散时间系统的最优控制策略,基于自适应动态规划的原理,提出了一种带误差限的自适应动态规划方法.对于一个任意的状态,用一个有限长度的控制序列近似最优控制序列,使性能指标与最优性能指标的误差在一个较小的范围内.选取一个非线性离散时间系统对算法的性能进行数值实验,结果验证了该算法的有效性,用较少的计算代价获得了近似最优的控制策略.  相似文献   

4.
林小峰  丁强 《控制与决策》2015,30(3):495-499
为了求解有限时域最优控制问题,自适应动态规划(ADP)算法要求受控系统能一步控制到零。针对不能一步控制到零的非线性系统,提出一种改进的ADP算法,其初始代价函数由任意的有限时间容许序列构造。推导了算法的迭代过程并证明了算法的收敛性。当考虑评价网络的近似误差并满足假设条件时,迭代代价函数将收敛到最优代价函数的有界邻域。仿真例子验证了所提出方法的有效性。  相似文献   

5.
针对一类非线性奇异摄动系统,基于自适应动态规划算法提出了一种新型的近似最优控制设计方法.该方法基于奇异摄动系统的快、慢Hamilton-Jacobi-Bellman(HJB)方程,从初始性能指标开始,通过神经网络的近似和控制律与性能指标的逐步更新迭代,最终收敛到最优的性能指标,而不用直接求解复杂的HJB方程.同时给出了...  相似文献   

6.
求矩阵方程AXB=C的双对称最小二乘解的迭代算法   总被引:1,自引:0,他引:1  
基于求解线性代数方程组的共轭梯度法的思想,通过特殊的变形与近似处理,建立了求矩阵方程AXB=C的双对称最小二乘解的迭代算法,并证明了迭代算法的收敛性.不考虑舍入误差时,迭代算法能够在有限步计算之后得到矩阵方程的双对称最小二乘解;选取特殊的初始矩阵时,还能够求得矩阵方程的极小范数双对称最小二乘解.同时,也能够给出指定矩阵的最佳逼近双对称矩阵.算例表明,迭代算法是有效的.  相似文献   

7.
基于数据自适应评判的离散2-D系统零和博弈最优控制   总被引:1,自引:1,他引:0  
提出了基于一种迭代自适应评判设计(ACD)算法解决一类离散时间Roesser型2-D系统的二人零和对策问题. 文章主要思想是采用自适应评判技术迭代的获得最优控制对使得性能指标函数达到零和对策的鞍点. 所提出的ACD可以通过输入输出数据进行实现而不需要系统的模型. 为了实现迭代ACD算法, 神经网络分别用来近似性能指标函数和计算最优控制率. 最后最优控制策略将应用到空气干燥过程控制中以证明其有效性.  相似文献   

8.
罗艳红  张化光  曹宁  陈兵 《自动化学报》2009,35(11):1436-1445
提出一种贪婪迭代DHP (Dual heuristic programming)算法, 解决了一类控制受约束非线性系统的近似最优镇定问题. 针对系统的控制约束, 首先引入一个非二次泛函把约束问题转换为无约束问题, 然后基于协状态函数提出一种贪婪迭代DHP算法以求解系统的HJB (Hamilton-Jacobi-Bellman)方程. 在算法的每个迭代步, 利用一个神经网络来近似系统的协状态函数, 而后根据协状态函数直接计算系统的最优控制策略, 从而消除了常规近似动态规划方法中的控制网络. 最后通过两个仿真例子证明了本文提出的最优控制方案的有效性和可行性.  相似文献   

9.
基于迭代LMI的直升机协调转弯控制律设计   总被引:1,自引:0,他引:1  
线性二次型控制是一类以线性系统为被控对象,以二次型泛函指标为性能指标的最优控制技术.由于标准最优控制算法具有一定的保守性,在运用线性矩阵不等式的控制理论的基础上,提出了一种迭代算法用于反馈阵的求解.以某型直升机为例,针对协调转弯侧滑过大问题,设计了最优控制与经典PID相结合的控制律结构.然后对选取的直升机典型状态进行了数字仿真.仿真结果表明,通过迭代线性矩阵不等式(ILMI)算法设计的协调转弯控制律,很好地消除了侧滑,取得了满意的控制效果.  相似文献   

10.
针对一类具有二次型性能指标的双线性系统的最优跟踪控制问题,提出了一种通过逐次逼近法设计最优控制律的近似方法。首先将状态向量含有时滞的双线性系统的最优跟踪问题转化为最优调节问题;然后利用逐次逼近算法,将既含有时滞项又含有超前项的两点边值问题转化为不含时滞项和超前项的线性两点边值问题族,得到调节系统的最优控制律,并可以通过截取最优控制序列的有限项得到调节系统的前馈-反馈次优控制律。最后,将最优控制问题转化为最优跟踪问题。仿真结果表明,此方法达到了较好的跟踪效果。  相似文献   

11.
利用数据驱动控制思想,建立一种设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法.提出针对离散时间一般非线性系统的迭代自适应动态规划算法并且证明其收敛性与最优性.通过构建三种神经网络,给出全局二次启发式动态规划技术及其详细的实现过程,其中执行网络是在神经动态规划的框架下进行训练.这种新颖的结构可以近似代价函数及其导函数,同时在不依赖系统动态的情况下自适应地学习近似最优控制律.值得注意的是,这在降低对于控制矩阵或者其神经网络表示的要求方面,明显地改进了迭代自适应动态规划算法的现有结果,能够促进复杂非线性系统基于数据的优化与控制设计的发展.通过两个仿真实验,验证本文提出的数据驱动最优调节方法的有效性.  相似文献   

12.
丛伟杰  刘红卫 《计算机科学》2013,40(9):234-236,253
首先,基于每次迭代计算距离当前球心最远的两个点,提出一种求解n维空间中m个点的最小闭包球问题的(1+ε)-近似算法.对于ε∈(0,1),建立了该算法的核心集大小和计算复杂度,分别为O(1/ε)和O(mn/ε).然后,给出一种积极集策略,每次迭代计算距离当前球心最远的N个点.将该策略结合到提出的算法中,得到一个基于积极集策略的算法.最后,实验结果表明基于积极集策略的算法能够快速、有效地求解m》n的大规模数据集的近似最小闭包球.  相似文献   

13.
输入饱和的双积分系统的复合时间最优控制   总被引:1,自引:0,他引:1       下载免费PDF全文
针对典型的有输入饱和的双积分环节或系统的时间最优控制问题,建立了双积分环节的传递函数和状态空间方程两种数学模型,设计双积分环节的闭环时间最优控制律;对时间最优控制在系统存在干扰和不确定性存在条件下出现的振颤现象进行分析;基于对振颤问题的分析,提出一种对时间最优控制的改进,即一种复合控制方法,当输入作用时,系统先由时间最优控制律控制,当误差达到预定值限,控制律由时间最优控制律切换到另一种线性控制律。采用了比例微分控制律,来解决时间最优控制的振颤问题,响应时间达到最优,并解决振颤问题。  相似文献   

14.
针对具有未知定常参数和标准Wiener噪声扰动的严格反馈非线性系统,结合参考信号,构造了误差系统,使用Backstepping算法设计了误差系统的自适应逆最优控制律和参数自适应律,进而解决了原系统的鲁棒自适应逆最优跟踪.  相似文献   

15.
李太全  肖柏勋 《计算机应用》2012,32(10):2742-2744
针对并行求解三对角线性方程组的对角占优(PDD)算法,在系数矩阵为弱对角占优时,近似处理引入误差较大的问题,提出了一种PDD算法的迭代方案。该方案在解的修正值计算中采用迭代方法,计算精度得到了提高;通过对算法的误差分析,导出了算法在给定误差下迭代次数的估算式;数值实验说明了算法的有效性。通过对迭代与非迭代的PDD算法的复杂性分析,迭代算法的计算复杂性增加很小,但通信复杂性随迭代次数成倍增加。  相似文献   

16.
基于自适应动态规划的导弹制导律研究综述   总被引:2,自引:0,他引:2  
孙景亮  刘春生 《自动化学报》2017,43(7):1101-1113
自适应动态规划(Adaptive dynamic programming,ADP)作为最优控制领域的近似优化方法,是求解复杂非线性系统最优控制问题的有力工具.近年来,已成为控制理论与计算智能领域的研究热点.本文着重介绍ADP算法的理论研究进展及其在航空航天领域的应用.分析了几种典型的制导律优化设计方法,以及ADP方法在导弹制导律设计中的应用现状和前景.  相似文献   

17.
迭代算法被广泛应用于代数方程求解中,但传统的迭代方法通常对初值的选取要求很高,在迭代过程中不能给出迭代误差,计算得到的单一近似解也具有一定的局限性.把区间迭代算法与神经网络相结合,提出了一种基于闭区间上神经网络迭代计算模型与方法,该方法与传统的迭代方法相比,具有收敛速度快、误差小等特点.最后,通过数值算例表明,该方法是有效的、可行的,能够快速地获得任意代数方程的根.  相似文献   

18.
为了解决初始和终端确定的一类离散时间非线性系统有限时间优化控制,利用动态规划原理求解过程中遇到维数灾的问题,提出了基于神经网络的自适应动态规划近似优化控制.在分析动态规划求解遇到维数灾的基础上,进而给出了迭代ADP算法,并采用神经网络近似代价函数和控制律来实现迭代ADP算法,设计近似优化控制器.通过mat lab实验仿真结果表明,采用迭代ADP算法能够避免求解中遇到的维数灾,从而有效地实现了一类离散时间非线性系统的有限时间近似优化控制.  相似文献   

19.
一种基于CORDIC算法的高精度反正切求解   总被引:1,自引:0,他引:1  
传统的CORDIC(坐标旋转计算机)算法进行高精度反正切求解时存在迭代次数多、收敛速度慢、资源消耗大等问题,提出一种改进的高精度CORDIC算法.该方法利用传统的CORDIC算法迭代数次后得到正弦信息,并利用角度和正弦值近似的原理,对迭代后的结果进行误差补偿,有效提高了相同迭代步数下的计算精度.实验数据表明:32位改进...  相似文献   

20.
提出线性离散时间系统基于Jacobi方法的迭代学习控制问题.通过构建线性迭代学习控制问题与线性方程组之间的联系,将Jacobi方法引入到迭代学习控制中,并由此构建得到迭代学习控制律.借助于矩阵运算,证明这种学习律能使得系统的输出跟踪误差经有限次迭代后为零.数值例子说明了算法的可适用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号