提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.
相似文献针对高超声速飞行器模型非线性、多变量和参数不确定特性, 并考虑控制增益变化可能导致控制奇异值问 题, 提出一种基于动态面的模糊自适应非线性控制方法. 根据动态面和动态逆策略, 分别设计了高度和速度跟踪控制 器. 利用模糊自适应方法在线逼近不确定函数项, 并采用Nussbaum 增益技术抑制虚拟控制增益不确定影响, 以减少 在线学习量, 保证系统的半全局一致最终有界性. 仿真结果表明, 所提出的方法可实现飞行器对高度和速度的准确跟 踪控制.
相似文献针对一类具有输入及状态未建模动态的非线性系统, 设计K滤波器来估计系统不可量测状态, 基于动态面控制技术并利用径向基函数神经网络的逼近能力, 提出一种输出反馈自适应跟踪控制方案. 利用Nussbaum 函数性质, 有效地解决了高频增益符号未知问题. 在控制器设计中引入规范化信号来约束输入未建模动态, 从而有效地抑制其产生的扰动. 通过理论分析证明了闭环控制系统是半全局一致终结有界的.
相似文献针对一类输入受限的不确定非仿射非线性系统跟踪控制问题, 提出一种二阶动态terminal 滑模控制策略. 在不损失模型精度, 并考虑系统输入饱和受限的前提下, 给出一种适用于全局的不确定非仿射非线性系统近似方法. 提出小波小脑模型干扰观测器设计方法, 实现复合扰动的有效逼近. 构造辅助系统分析输入饱和对跟踪误差的影响. 通过构造基于PI 滑模面的terminal 二阶滑模面, 给出二阶动态terminal 滑模控制器设计过程, 克服了传统滑模的抖振问题. 仿真结果验证了所提出方法的有效性.
相似文献复杂环境下的多普勒频移变化及信号功率衰减均会对载波准确跟踪造成影响. 在研究北斗卫星B1 频点信号结构的基础上, 建立以环路中相关积分值为观测量的非线性EKF 模型和UKF模型, 并提出利用滤波估计状态量进行状态反馈控制的方法, 从而解决了载波跟踪环路在高动态及弱信号环境中难以高性能工作的问题. 实验结果表明,状态反馈控制的EKF 模型和UKF滤波模型能准确地跟踪弱信号及高动态下的信号变化, 从而有效控制跟踪误差, 为实现快速准确的载波跟踪奠定了基础.
相似文献针对服务覆盖网络中的自私路由造成的网络流量失衡将严重影响网络效率和稳定性的问题, 研究如何在覆 盖层应用动态流量工程的方法进行流量优化分配. 基于随机动态优化配流理论, 提出一种服务覆盖网络的动态流量 工程模型, 并设计了分布式的流量工程算法. 该算法可以折衷控制路由的自私与负载均衡的程度. 模拟实验显示, 所 提出的方法较其他方法具有更好的性能, 尤其对于实时动态流量有着较好的适应性.
相似文献针对系统模型的不确定性、未知输入扰动和非线性特性, 提出一类非线性系统参数估计的故障诊断算法. 构造系统故障诊断观测器, 采用Lyapunov 稳定性定理验证观测器的稳定性, 通过Barbalat 引理证明满足故障诊断观测器为渐近稳定的表征故障参数的参数估计, 并总结了设计算法流程. 仿真结果表明, 所提出算法具有快速收敛性, 对一类非线性系统诊断效果较好.
相似文献研究一类单输入单输出动态不确定非线性系统的几乎干扰解耦问题. 首先设计一类新型的模糊高增益观测器估计非线性系统的未知状态; 然后结合自适应模糊backstepping 控制、小增益定理和改变供能函数方法, 给出鲁棒自适应模糊控制器的设计. 所设计的控制器不仅可以保证整个闭环系统在输入到状态实际稳定意义下稳定, 同时抑制了干扰对输出的影响. 仿真结果表明了所提出控制方法的有效性.
相似文献针对较强非线性的控制问题, 提出一种以RBF 神经网络为模型的多步预测控制方法. 构建多步预测模型, 并给出预测误差关于控制序列的雅可比矩阵的计算方法. 利用Levenberg-Marquardt(L-M) 算法设计滚动优化策略, 过误差修正参考输入的方法实现了反馈校正, 证明了控制系统的稳定性. 仿真结果表明所提出的控制方法效果较好.
相似文献基于滞环函数提出一种参数可调的多涡卷混沌系统构造方法. 针对复杂不确定性系统, 综合利用自适应神经网络和重复学习控制方法设计一种自适应重复学习同步控制器; 利用自适应重复学习控制方法对周期时变参数化不确定性进行处理; 对函数型不确定性利用神经网络逼近技术进行补偿; 设计鲁棒学习项对神经网络逼近误差和扰动上界进行估计; 通过构造类Lyapunov 复合能量函数证明了同步误差学习的收敛性. 仿真结果验证了所提出方法的有效性.
相似文献针对非均匀多采样率非线性系统辨识问题, 提出一种基于模糊模型的辨识方法. 首先, 分析了非线性系统在输入信号非均匀周期刷新, 输出信号周期采样的情况下, 非线性系统可以通过提升技术, 利用多个局部的线性模型加权组合来描述; 然后, 提出一个基于GK模糊聚类和递推最小二乘的模糊辨识算法; 最后, 针对化工pH 中和过程非线性系统, 采用非均匀采样数据建立其模糊模型, 以验证所提出方法的有效性.
相似文献针对非线性模型预测控制中离线模型难以适应非线性对象实时变化的缺点, 提出一种基于在线支持向量回归的非线性模型预测控制方法. 该方法通过在线支持向量回归离线训练与在线学习相结合的方式, 建立具有在线校正特性的预测模型, 同时采用最速下降原理滚动优化非线性模型预测控制的目标函数, 求得多步控制量. 通过对非线性对象的控制结果表明, 所提出方法有效且具有良好的自适应性.
相似文献