基于强化学习的一类具有输入约束非线性系统最优控制 |
| |
作者姓名: | 罗傲 肖文彬 周琪 鲁仁全 |
| |
作者单位: | 广东工业大学广东省智能决策与协同控制重点实验室,广东广州510006 |
| |
基金项目: | 国家自然科学基金项目(62121004, 61973091),“广东特支计划”本土创新创业团队项目(2019BT02X353), 广东省重点领域研发计划项目 (2021B0101410005)资助. |
| |
摘 要: | 针对部分系统存在输入约束和不可测状态的最优控制问题,本文将强化学习中基于执行–评价结构的近似最优算法与反步法相结合,提出了一种最优跟踪控制策略.首先,利用神经网络构造非线性观测器估计系统的不可测状态.然后,设计一种非二次型效用函数解决系统的输入约束问题.相比现有的最优方法,本文提出的最优跟踪控制方法不仅具有反步法在处理...
|
关 键 词: | 输入约束 不可测状态 最优控制 强化学习 反步法 |
收稿时间: | 2020-12-14 |
修稿时间: | 2021-06-25 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《控制理论与应用》浏览原始摘要信息 |
|
点击此处可从《控制理论与应用》下载免费的PDF全文 |
|