摘 要: | 基于自适应迭代算法、两人零和微分博弈和神经网络,文章研究了不确定扰动的级联非线性系统的跟踪控制问题。利用零和博弈算法,将控制和扰动作为博弈的双方,博弈的纳什均衡解将提供有界L2增益问题的解决方案,因此对于鲁棒控制非常重要。但其解决方案取决于求解设计Hamilton-Jacobi-Isaacs(HJI)方程。所以文章利用了一种基于策略迭代的在线自适应学习算法,用于解决具有已知动态的非线性系统的连续时间两人无限时延零和博弈问题。给出了针对RBF神经网络的新型优化算法,证明了最佳鞍点解的收敛性,并且还保证了系统的稳定性。仿真实例表明,该新算法在线求解线性系统和复杂非线性系统的HJI方程是有效的。
|