提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.
相似文献针对模型参数部分未知的随机线性连续时间系统, 通过策略迭代算法求解无限时间随机线性二次(LQ) 最优控制问题. 求解随机LQ最优控制问题等价于求随机代数Riccati 方程(SARE) 的解. 首先利用伊藤公式将随机微分方程转化为确定性方程, 通过策略迭代算法给出SARE 的解序列; 然后证明SARE 的解序列收敛到SARE 的解, 而且在迭代过程中系统是均方可镇定的; 最后通过仿真例子表明策略迭代算法的可行性.
相似文献采用自抗扰控制技术解决网络化无刷直流电机转速控制系统的时延补偿问题. 首先, 建立含有时变网络诱导时延的无刷直流电机控制系统模型, 并将时变时延引起的不确定动态描述为系统模型的不确定性; 然后, 设计自抗扰控制器, 对时延引起的不确定动态进行动态线性化补偿, 从而消除时变时延对系统性能的影响; 最后, 通过仿真研究表明了所设计的自抗扰补偿方法的有效性和优越性.
相似文献为了进一步提高伪谱最优控制方法的计算精度, 削弱微分形式伪谱法对状态变量近似误差的放大幅度, 研究基于积分形式的伪谱最优控制方法. 依次给出3 种伪谱法的积分伪谱离散形式, 证明当Lagrange 多项式对状态变量的近似误差等于零时, Gauss 伪谱法和Radau 伪谱法的积分形式与微分形式是等价的, 而Legendre 伪谱法的积分形式与微分形式是不等价的, 并分析了其不等价的原因.
相似文献针对离散时间非线性系统, 提出事件触发传输机制下网络化T-S 模糊控制器设计方法. 在事件发生器中引入前提变量偏差触发条件, 从而取消模糊控制器与被控对象的前提变量之间的同步要求. 通过引入一组基于模糊前提变量特性的松弛等式/不等式, 对于无传输时滞和定常传输时滞两种情况, 分别提出具有较小保守性的控制器/事件发生器联合设计算法. 最后, 通过数值算例表明所提出方法的可行性和有效性.
相似文献研究存在未知短时延、丢包和系统不确定性的网络化切换控制系统故障检测与时域优化问题. 首先基 于观测器构建残差发生器, 结合Lyapunov 函数方法和平均驻留时间方法分析系统的稳定性, 并以线性矩阵不等式(LMI) 形式给出故障检测滤波器的求解方法; 然后为了改善故障检测系统的性能, 采用后置滤波器对残差信号进行时域优化, 并利用奇偶空间方法给出其最优解; 最后设计并推导出自适应阈值. 仿真结果验证了所提出方法的有效性.
相似文献针对一类非线性离散时间系统给出最优预见控制器设计方法. 首先运用非线性控制系统直接控制方法的思想, 将非线性反馈部分作为形式输入, 使得系统成为“形式上”的线性系统; 然后, 针对该线性系统, 利用最优预见控制的基本方法设计最优预见控制器; 最后, 利用形式输入与实际输入的关系得到非线性离散时间系统的最优预见控制器. 证明了如果形式线性系统满足一定的可镇定和可检测条件, 则闭环系统是渐近稳定的. 数值仿真结果表明了控制器的有效性.
相似文献考虑一类不受控离散事件驱动不确定约束线性切换系统, 提出具有任意切换特性的约束优化控制策略. 引入有限时域性能函数, 定义约束最优控制问题. 为降低控制器的在线计算量, 通过参数化方法压缩最优控制问题决策变量的维数. 应用公共Lyapunov 函数和控制Lyapunov 函数理论建立的闭环切换系统, 具有对不确定扰动和不受控切换信号的渐近稳定性和逆最优性. 最后通过算例仿真验证了结果的有效性.
相似文献针对线性奇异摄动系统, 提出一种基于PI (proportional integral) 观测器的故障诊断和最优容错控制方法. 基于奇异摄动系统相关理论和矩阵变换技术, 给出PI 全维观测器存在的条件, 该观测器可以观测系统的快慢状态和故障系统的状态. 在估测到系统状态的基础上进一步考虑最优性, 应用最优控制理论, 设计状态反馈控制器, 提出基于PI 观测器的故障诊断器和最优容错控制器的设计方法. 最后的数值算例验证了所提出方法的可行性和正确性.
相似文献将网络控制系统(NCSs) 的未知短时延处理成范数有界不确定性, 结合Markov 丢包影响将NCSs 建模为不确定Markov 跳变系统, 设计模态依赖的鲁棒故障检测滤波器. 为了提高检测系统性能, 采用后置滤波器对残差信号进行时域优化, 并以Moore-Penrose 逆形式给出其最优解. 同时, 设计自适应检测阈值, 并给出时变参数阵的迭代方法,降低了计算量. 数值仿真表明, 所提出的方法能够有效地抑制时延和丢包影响, 提高故障检测系统的检测能力和检测速度.
相似文献