共查询到20条相似文献,搜索用时 234 毫秒
1.
介绍输出概率密度函数(PDF)常规的迭代学习控制(ILC)的收敛条件,并利用此条件设计相应的迭代学习律.主要讨论如何解决输出PDF迭代学习控制(ILC)中的过迭代,收敛速度等问题.以离散输出概率密度函教(PDF)控制模型为基础,介绍了直接迭代学习控制算法收敛的必要条件,提出自适应的迭代学习参数调节方法和避免过迭代的迭代结束条件,这些措施能够保证输出PDF的迭代控制收敛且具有较快的收敛速度.仿真结果表明,输出PDF的自适应迭代学习控制具有较快的收敛速度,而学习终止条件能很好地避免过迭代. 相似文献
2.
3.
无奇异间接迭代学习控制及其在机器人运动模仿中的应用 总被引:4,自引:0,他引:4
针对相当广泛的一类非线性系统有限时间轨迹跟踪问题,提出了间接迭代学习方案.
采用最小二乘算法,根据重复跟踪历史辨识非线性系统的线性化模型.利用一个分段学习方案
可保证学习控制总在有效线性近似区域内进行.探讨了如何在学习过程中避免控制奇异问题,
提出了一种高效的参数修正方法,保证输入耦合矩阵的估计行列式不为零.本文将这一控制方
案应用于未知机器人及摄像机模型下的机器人运动模仿中,而不面临任何奇异问题.这是一个
采用摄像机替代传统程序编写的新的机器人编程方法. 相似文献
4.
5.
学习控制的现状与展望 总被引:25,自引:1,他引:25
在此我们综述学习控制理论的发展历程.首先给出基于可重复性的学习控制的基本概念与原理.然后简述学习控制的两大主流---迭代学习控制和反复控制.接着对当今迭代学习控制理论前沿的几大热点加以考察,并简要介绍学习控制理论和Lyapunov方法的结合.最后讨论学习控制理论的新发展方向. 相似文献
6.
本文通过对迭代学习控制机理的分析,提出了一种新的迭代学习控制方法.根据 Banach 不动点定理和高增益反馈原理,给出了这种方法的稳定条件,证明了这种学习控制器的设计问题可以转化为反馈控制器的设计问题.文中讨论了这种方法在机器人控制中的应用问题,给出了对三自由度机器人的仿真结果. 相似文献
7.
本文将学习控制和神经网络方法结合起来,既避免了前者对重复性的要求,又避免了后者对于快速系统实时的控制的困难,将其应用于对液压转台中偏载干扰的抑制,取得了良好的仿真结果。 相似文献
8.
针对基于迭代学习控制的交通信号控制方法对于路网中存在的非重复性实时干扰不能进行有效处理的问题,本文在基于迭代学习控制的交通信号控制方法基础上,结合模型预测控制滚动优化和实时校正的特点,提出了一种基于迭代学习与模型预测控制的交通信号混合控制方法.该方法在有效利用交通流周期性特征改善路网交通状况的同时,可借助模型预测控制的优点对非重复性的实时干扰进行处理,从而进一步提高交通信号的控制效率.通过仿真实验对该方法的有效性进行了验证.实验结果表明,基于迭代学习与模型预测控制的交通信号混合控制方法能够更有效地均衡路网内的车辆密度,进一步提高了路网的通行效率.最后,本文还对该方法的收敛性进行了分析. 相似文献
9.
10.
介绍输出概率密度函数(PDF)常规的迭代学习控制(ILC)的收敛条件,并利用此条件设计相应的迭代学习律。主要讨论如何解决输出PDF迭代学习控制(ILC)中的过迭代,收敛速度等问题。以离散输出概率密度函数(PDF)控制模型为基础,介绍了直接迭代学习控制算法收敛的必要条件,提出自适应的迭代学习参数调节方法和避免过迭代的迭代结束条件,这些措施能够保证输出PDF的迭代控制收敛且具有较快的收敛速度。仿真结果表明,输出PDF的自适应迭代学习控制具有较快的收敛速度,而学习终止条件能很好地避免过迭代。 相似文献
11.
利用H∞范数对异步自学习控制系统进行了深入的研究.基于用H∞语言重新改写的问
题提法,给出了四个引理与一个定理的严格证明,得到了渐近稳定时控制器存在的一个充分条
件,并给出了计算实例. 相似文献
12.
异步自学习控制的频域稳定性分析 总被引:1,自引:0,他引:1
本文首先研究了一般频域形式的异步自学习控制系统的稳定性,然后基于渐消记忆和Ek+1(s)反馈,得到了一种稳定域更宽的重要变形,并证明了有关的定理一推论,给出了学习矩阵与稳定圆的几何关系,文中还进一步利用DNA法,得到一个渐近稳定条件,给出若干结论。 相似文献
13.
In this paper, the stability of iterative learning control with data dropouts is discussed. By the super vector formulation, an iterative learning control (ILC) system with data dropouts can be modeled as an asynchronous dynamical system with rate constraints on events in the iteration domain. The stability condition is provided in the form of linear matrix inequalities (LMIS) depending on the stability of asynchronous dynamical systems. The analysis is supported by simulations. 相似文献
14.
15.
《国际计算机数学杂志》2012,89(6):643-658
This paper adopts a reinforcement learning control using frequency domain method for a SISO system with friction and input-saturation process. Based on the two-dimensional system theory, the proposed method investigates the robust stability criteria of the SISO iterative learning control system (ILCS) using frequency domain methods. The restrictive conditions for the stability of the ILCS are also derived. A design procedure for the ILCS is outlined. A numerical simulation example is given to demonstrate the utilization of obtained results. 相似文献
16.
As a powerful tool for solving nonlinear complex system control problems, the model-free reinforcement learning hardly guarantees system stability in the early stage of learning, especially with high complicity learning components applied. In this paper, a reinforcement learning framework imitating many cognitive mechanisms of brain such as attention, competition, and integration is proposed to realize sample-efficient self-stabilized online learning control. Inspired by the generation of consciousness in human brain, multiple actors that work either competitively for best interaction results or cooperatively for more accurate modeling and predictions were applied. A deep reinforcement learning implementation for challenging control tasks and a real-time control implementation of the proposed framework are respectively given to demonstrate the high sample efficiency and the capability of maintaining system stability in the online learning process without requiring an initial admissible control. 相似文献
17.
《国际计算机数学杂志》2012,89(11):1339-1353
This paper adopts a reinforcement learning control using the frequency domain method for a SISO system with friction and input saturation process. The proposed method, which is based on two-dimensional system theory, investigates the robust stability criteria of the SISO iterative learning control system ({ILCS}) using frequency domain methods. The restrictive conditions for the stability of the {ILCS} are also derived. A design procedure for the {ILCS} is outlined. A numerical simulation example is given to demonstrate the utilization of obtained results. 相似文献
18.
19.
针对一类时变切换系统,当考虑子系统具有分数阶(Fractional Order)特性时,提出了一种基于模型依赖平均驻留时间方法的有限时间稳定性条件及异步切换控制策略.借助于Caputo分数阶导数引理和切换Lyapunov函数,利用矩阵不等式技术提出了分数阶时变切换系统有限时间稳定的充分条件.将有限时间稳定的结果进一步推广到有限时间有界的情形,利用平均驻留时间思想提出了分数阶时变切换系统有限时间有界的充分条件,基于该条件设计了系统的异步切换控制器.所给出的设计方法将系统异步切换控制问题转化为矩阵不等式组的求解问题.通过数值仿真验证了所提控制方法的有效性. 相似文献