共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
3.
针对存在线性外部干扰和状态反馈过程中发生丢包的网络控制系统的跟踪控制问题,采用输出调节的思想,提出基于离轨策略强化学习的数据驱动最优输出调节控制方法,实现仅利用在线数据即可求解控制策略.首先,对系统状态在网络传输过程存在丢包的情况,利用史密斯预估器重构系统的状态;然后基于输出调节控制框架,提出一种基于离轨策略强化学习的数据驱动最优控制算法,在系统状态发生丢包时仅利用在线数据计算反馈增益,在求解反馈增益过程中找到与求解输出调节问题的联系;接着基于求解反馈增益过程中得到的与输出调节问题中求解调节器方程相关的参数,计算前馈增益的无模型解;最后,通过仿真结果验证所提出方法的有效性. 相似文献
4.
非线性系统输出调节问题可解的充要条件是存在一个中心流形满足某个非线性偏微分方程。本文用多层前向神经网络求解该非线性偏微分方程,从而逼近非线性系统的中心流形。在此基础上,构造状态反馈控制律,实现非线性系统的输出调节。 相似文献
5.
经输出动态反馈的非线性奇异系统输出调节问题 总被引:1,自引:2,他引:1
讨论非线性奇异系统的输出调节问题,在没有可正常化的假设条件下,给出了降阶的正常状态空间的输出动态反馈控制器的设计,并导出了这种控制器存在的充分必要条件. 相似文献
6.
针对离散多智能体系统输出调节,提出了一种基于Q学习的最优控制策略。对于传统多智能体系统的输出调节,获取系统的精确动力学模型并依此求得其HJB方程的解为主要障碍。该策略通过智能体之间的局部通信,在不依赖系统动态模型的前提下实现了对每个智能体输出的全局最优控制。为实现对系统响应速率的优化,提出了一种新的有限时间局部误差公式,不仅保证了算法原有的全局最优性能,而且将输出同步时间缩短了近50%,并对所提算法的稳定性进行了分析。仿真结果表明,该策略在避免建立复杂系统模型和求解离散HJB方程的前提下实现了对系统的最优控制,采用更新后的有限时间局部误差公式有效缩短了收敛时间。 相似文献
7.
电弧炉电极调节系统的离散时间自适应控制 总被引:5,自引:0,他引:5
提出了电弧炉电极调节系统的数学模型,并在此模型基础上推导出了离散时间模型参考自适应控制规律。然后根据推导出的自适应律对电弧炉系统进行仿真研究,仿真结果表明自适应控制系统具有较好的跟踪性能。 相似文献
8.
9.
本文用中心流形理论^[7]及动力系统方法^[8],考虑了一般非线性系统的输出调节问题,在弱于Isidori和Byrnes^[6]的条件下,得到了这问题可解的充分必要条件。 相似文献
10.
11.
In this paper, a data-driven control approach is developed by reinforcement learning (RL) to solve the global robust optimal output regulation problem (GROORP) of partially linear systems with both static uncertainties and nonlinear dynamic uncertainties. By developing a proper feedforward controller, the GROORP is converted into a global robust optimal stabilization problem. A robust optimal feedback controller is designed which is able to stabilize the system in the presence of dynamic uncertainties. The closed-loop system is ensured to be input-to-output stable regarding the static uncertainty as the external input. This robust optimal controller is numerically approximated via RL. Nonlinear small-gain theory is applied to show the input-to-output stability for the closed-loop system and thus solves the original GROORP. Simulation results validates the efficacy of the proposed methodology. 相似文献
12.
Hongjing Liang Huaguang Zhang Zhanshan Wang Junyi Wang 《IEEE/CAA Journal of Automatica Sinica》2014,1(2):204-209
This paper deals with consensus robust output regulation of discrete-time linear multi-agent systems under a directed interaction topology. The digraph is assumed to contain a spanning tree. Every agent or subsystem is identical and uncertain, but subsystems have different external disturbances. Based on the internal model and general discrete-time algebraic Riccati equation, a distributed consensus protocol is proposed to solve the regulator problem. A numerical simulation demonstrates the effectiveness of the proposed theoretical results. 相似文献
13.
Near Optimal Output Feedback Control of Nonlinear Discrete-time Systems Based on Reinforcement Neural Network Learning 下载免费PDF全文
In this paper, the output feedback based finitehorizon near optimal regulation of nonlinear affine discretetime systems with unknown system dynamics is considered by using neural networks (NNs) to approximate Hamilton-Jacobi-Bellman (HJB) equation solution. First, a NN-based Luenberger observer is proposed to reconstruct both the system states and the control coefficient matrix. Next, reinforcement learning methodology with actor-critic structure is utilized to approximate the time-varying solution, referred to as the value function, of the HJB equation by using a NN. To properly satisfy the terminal constraint, a new error term is defined and incorporated in the NN update law so that the terminal constraint error is also minimized over time. The NN with constant weights and timedependent activation function is employed to approximate the time-varying value function which is subsequently utilized to generate the finite-horizon near optimal control policy due to NN reconstruction errors. The proposed scheme functions in a forward-in-time manner without offline training phase. Lyapunov analysis is used to investigate the stability of the overall closedloop system. Simulation results are given to show the effectiveness and feasibility of the proposed method. 相似文献
14.
不确定离散线性系统的鲁棒镇定 总被引:14,自引:1,他引:14
针对一类具有范数有界时变不确定性的离散性线系统,研究其二次稳定化状态反馈控制律的设计问题。推导出二次稳定化控制律存在一个充分必要条件,该条件被塌一步等价地表示成一个线性矩阵不等式的可解性问题。后者可用现有方法方便地求解,且它的解提供了所有二次稳定定化控制律的一个参数化表示。 相似文献
15.
为克服全状态对称约束以及控制策略频繁更新的局限,同时使得无限时间的代价函数最优,针对一类具有部分动力学未知的仿射非线性连续系统,提出一种带状态约束的事件触发积分强化学习的控制器设计方法。该方法是一种基于数据的在线策略迭代方法。引入系统转换将带有全状态约束的系统转化为不含约束的系统。基于事件触发机制以及积分强化学习算法,通过交替执行系统转换、策略评估、策略改进,最终系统在满足全状态约束的情况下,代价函数以及控制策略将分别收敛于最优值,并能降低控制策略的更新频率。此外,通过构建李亚普诺夫函数对系统以及评论神经网络权重误差的稳定性进行严格的分析。单连杆机械臂的仿真实验也进一步说明算法的可行性。 相似文献
16.
Jianguo Zhao Chunyu Yang Weinan Gao Linna Zhou Xiaomin Liu 《IEEE/CAA Journal of Automatica Sinica》2024,11(3):595-607
This article studies the adaptive optimal output regulation problem for a class of interconnected singularly perturbed systems(SPSs) with unknown dynamics based on reinforcement learning(RL). Taking into account the slow and fast characteristics among system states, the interconnected SPS is decomposed into the slow time-scale dynamics and the fast timescale dynamics through singular perturbation theory. For the fast time-scale dynamics with interconnections, we devise a decentralized optimal co... 相似文献
17.
18.
针对具有外部系统扰动的线性离散时间系统的输出调节问题, 提出了可保证收敛速率的数据驱动最优输出调节方法, 包括状态可在线测量系统的基于状态反馈的算法, 与状态不可在线测量系统的基于输出反馈的算法. 首先, 该问题被分解为输出调节方程求解问题与反馈控制律设计问题, 基于输出调节方程的解, 通过引入收敛速率参数, 建立了可保证收敛速率的最优控制问题, 通过求解该问题得到具有保证收敛速率的输出调节器. 之后, 利用强化学习的方法, 设计基于值迭代的数据驱动状态反馈控制器, 学习得到基于状态反馈的最优输出调节器. 对于状态无法在线测量的被控对象, 利用历史输入输出数据对状态进行重构, 并以此为基础设计基于值迭代的数据驱动输出反馈控制器. 仿真结果验证了所提方法的有效性. 相似文献