共查询到20条相似文献,搜索用时 31 毫秒
1.
针对一类带有执行器饱和的未知动态离散时间非线性系统, 提出了一种新的最优跟踪控制方案. 该方案基于迭代自适应动态规划算法, 为了实现最优控制, 首先建立了未知系统动态的数据辨识器. 通过引入M网络, 获得了稳态控制的精确表达式. 为了消除执行器饱和的影响, 提出了一个非二次的性能指标函数. 然后提出了一种迭代自适应动态规划算法获得最优跟踪控制的解, 并给出了收敛性分析. 为了实现最优控制方案, 神经网络被用来构建数据辨识器、计算性能指标函数、近似最优控制策略和求解稳态控制. 仿真结果验证了本文所提出的最优跟踪控制方法的有效性. 相似文献
2.
基于自适应动态规划的一类带有时滞的离散时间非线性系统的最优控制策略 总被引:4,自引:3,他引:1
针对一类状态和控制变量均带有时滞的非线性系统的带有二次性能指标函数最优控制问题, 本文提出了一种基于新的迭代自适应动态规划算法的最优控制方案. 通过引进时滞矩阵函数, 应用动态规划理论, 本文获得了最优控制的显式表达式, 然后通过自适应评判技术获得最优控制量. 本文给出了收敛性证明以保证性能指标函数收敛到最优. 为了实现所提出的算法, 本文采用神经网络近似性能指标函数、计算最优控制策略、求解时滞矩阵函数、以及给非线性系统建模. 最后本文给出了两个仿真例子说明所提出的最优策略的有效性. 相似文献
3.
4.
为有效控制离散非线性系统,使系统控制策略能够应对状态域的所有初始状态,在近似动态规划方法的基础上,提出一个未固定初始状态的带ε误差限的离散非线性系统优化控制算法。研究初始状态对离散系统控制策略的影响,确定在初始状态域边界上寻找最优初始点的方法。所求控制策略使初始状态域的所有性能指标函数在最大迭代步数内收敛,使性能指标与最优性能指标保持在精度ε内。为了易于实现算法,使用神经网络来近似性能指标函数和最优控制策略。结合实例,对该算法进行仿真分析,分析结果表明了算法的有效性。 相似文献
5.
利用数据驱动控制思想,建立一种设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法.提出针对离散时间一般非线性系统的迭代自适应动态规划算法并且证明其收敛性与最优性.通过构建三种神经网络,给出全局二次启发式动态规划技术及其详细的实现过程,其中执行网络是在神经动态规划的框架下进行训练.这种新颖的结构可以近似代价函数及其导函数,同时在不依赖系统动态的情况下自适应地学习近似最优控制律.值得注意的是,这在降低对于控制矩阵或者其神经网络表示的要求方面,明显地改进了迭代自适应动态规划算法的现有结果,能够促进复杂非线性系统基于数据的优化与控制设计的发展.通过两个仿真实验,验证本文提出的数据驱动最优调节方法的有效性. 相似文献
6.
基于自适应最优控制的有限时间微分对策制导律 总被引:1,自引:0,他引:1
针对固定末端时刻拦截机动目标的制导系统,本文首先构建了非线性有限时间微分对策框架,将导弹拦截非线性系统的最优问题转化为一般非线性系统的最优控制问题,并通过自适应动态规划算法(adaptive dynamic programming, ADP)获得近似最优值函数与最优控制策略.为了有效实现该算法,本文利用一个具有时变权值和激活函数的评价网络来逼近Hamilton-Jacobi-Isaacs(HJI)方程的解,并在线更新.通过李雅普诺夫法来证明本文提出的控制策略可保证闭环微分对策系统稳定性和评价网络权值近似误差的有界性.最后给出一个非线性导弹拦截目标系统的仿真例子验证了该方法的可行性和有效性. 相似文献
7.
8.
9.
10.
11.
针对非线性连续系统难以跟踪时变轨迹的问题,本文首先通过系统变换引入新的状态变量从而将非线性系统的最优跟踪问题转化为一般非线性时不变系统的最优控制问题,并基于近似动态规划算法(ADP)获得近似最优值函数与最优控制策略.为有效地实现该算法,本文利用评价网与执行网来估计值函数及相应的控制策略,并且在线更新二者.为了消除神经网络近似过程中产生的误差,本文在设计控制器时增加一个鲁棒项;并且通过Lyapunov稳定性定理来证明本文提出的控制策略可保证系统跟踪误差渐近收敛到零,同时也验证在较小的误差范围内,该控制策略能够接近于最优控制策略.最后给出两个时变跟踪轨迹实例来证明该方法的可行性与有效性. 相似文献
12.
研究了一类离散线性切换系统在切换时间、切换次数固定的情况下的二次最优控制问题.利用离散动态规划的方法,将多级决策过程分解成一系列易于求解的单级决策过程,求出最优控制序列和最优切换序列,并给出算法.最后通过一个数值例子来说明所提出的方法的有效性. 相似文献
13.
为克服现有近似最优跟踪控制方法只能跟踪连续可微参考输入的局限,本文针对一类具有未知动态的连续时间非线性时不变仿射系统,提出了一种新的基于自适应动态规划的鲁棒近似最优跟踪控制方法.首先采用递归神经网络建立系统模型,然后建立评价神经网络对最优性能指标进行估计,从而得到最优性能指标偏导数的估计值,进而得到近似最优跟踪控制器,最后利用系统输出与参考输入之间的跟踪误差设计鲁棒项对神经网络建模误差进行补偿.分别针对两个非线性系统进行仿真实验,仿真结果表明了所提方法的有效性和优越性. 相似文献
14.
为了求解有限时域最优控制问题,自适应动态规划(ADP)算法要求受控系统能一步控制到零。针对不能一步控制到零的非线性系统,提出一种改进的ADP算法,其初始代价函数由任意的有限时间容许序列构造。推导了算法的迭代过程并证明了算法的收敛性。当考虑评价网络的近似误差并满足假设条件时,迭代代价函数将收敛到最优代价函数的有界邻域。仿真例子验证了所提出方法的有效性。 相似文献
15.
16.
应用一种新的自适应动态最优化方法(ADP),在线实现对非线性连续系统的最优控制。首先应用汉密尔顿函数(Hamilton-Jacobi-Bellman, HJB)求解系统的最优控制,并应用神经网络BP算法对汉密尔顿函数中的性能指标进行估计,进而得到非线性连续系统的最优控制。同时引进一种新的自适应算法,基于参数误差,在线实现对系统进行动态最优求解,而且通过李亚普诺夫方法对参数收敛情况也进行详细的分析。最后,用仿真结果来验证所提出的方法的可行性。 相似文献
17.
为了解决初始和终端确定的一类离散时间非线性系统有限时间优化控制,利用动态规划原理求解过程中遇到维数灾的问题,提出了基于神经网络的自适应动态规划近似优化控制.在分析动态规划求解遇到维数灾的基础上,进而给出了迭代ADP算法,并采用神经网络近似代价函数和控制律来实现迭代ADP算法,设计近似优化控制器.通过mat lab实验仿真结果表明,采用迭代ADP算法能够避免求解中遇到的维数灾,从而有效地实现了一类离散时间非线性系统的有限时间近似优化控制. 相似文献
18.
为了确保城市路网交通流平稳运行和各路段交通流量合理分配,提出了一种基于变结构动态BN的最优交通路径规划方法。该方法考虑驾驶员偏好,按时间序列建立适用于交通路径规划的变结构离散动态BN模型,采用最大似然估计算法和参数的自适应产生算法学习网络参数,用基于时间窗的动态BN近似推理算法中固定窗口宽度方法进行在线推理。结合实例对算法进行仿真,并与Dijkstra算法所得结果进行比较。实验结果表明变结构离散动态BN能利用实时采集到的信息对最优路径进行实时更新,在线决策。 相似文献
19.
20.
针对状 态和控制输入均含有时滞的离散时间系统, 提出最优跟踪控制的设计方法. 通 过引入一种新的状态向量, 将含有状态和控制输入时滞的离散时间系统转化为 含有虚拟扰动项的无时滞离散时间系统. 根据最优控制理论, 构造离散Riccati矩阵方 程和离散Stein矩阵方程的序列, 并证明该解序列一致收敛于变换后的离散时间系统的最优跟 踪控制策略. 利用最优控制的逐次逼近设计方法, 得到最优跟踪控制的近似 解, 并给出求解最优跟踪控制律的算法. 仿真算例表明了所提出最优跟踪控制 方法的有效性. 相似文献