首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
介绍输出概率密度函数(PDF)常规的迭代学习控制(ILC)的收敛条件,并利用此条件设计相应的迭代学习律.主要讨论如何解决输出PDF迭代学习控制(ILC)中的过迭代,收敛速度等问题.以离散输出概率密度函教(PDF)控制模型为基础,介绍了直接迭代学习控制算法收敛的必要条件,提出自适应的迭代学习参数调节方法和避免过迭代的迭代结束条件,这些措施能够保证输出PDF的迭代控制收敛且具有较快的收敛速度.仿真结果表明,输出PDF的自适应迭代学习控制具有较快的收敛速度,而学习终止条件能很好地避免过迭代.  相似文献   

2.
针对不确定的多连杆机械手的跟踪控制问题,提出一种基于边界层的自适应迭代学习控制方法.自适应控制用来估计系统的未知参数的上界,本文主要特征是基于边界层设计自适应迭代学习控制器,避免了传统方法设计控制器的不连续性,削弱抖振现象的同时也提高系统的鲁棒性.理论证明系统所有信号有界,系统误差渐进收敛到边界层邻域内.仿真表明了算法的有效性.  相似文献   

3.
无奇异间接迭代学习控制及其在机器人运动模仿中的应用   总被引:4,自引:0,他引:4  
针对相当广泛的一类非线性系统有限时间轨迹跟踪问题,提出了间接迭代学习方案. 采用最小二乘算法,根据重复跟踪历史辨识非线性系统的线性化模型.利用一个分段学习方案 可保证学习控制总在有效线性近似区域内进行.探讨了如何在学习过程中避免控制奇异问题, 提出了一种高效的参数修正方法,保证输入耦合矩阵的估计行列式不为零.本文将这一控制方 案应用于未知机器人及摄像机模型下的机器人运动模仿中,而不面临任何奇异问题.这是一个 采用摄像机替代传统程序编写的新的机器人编程方法.  相似文献   

4.
基于BP神经网络的迭代学习初始控制策略研究   总被引:1,自引:0,他引:1  
针对传统迭代学习控制(ILC)在面临新的环境或控制任务时学习时间长、收敛速度慢的问题,提出基于BP神经网络的迭代学习初始控制策略。通过BP神经网络拟和经验数据,对以往控制经验加以充分利用,避免了对初始控制输入量的盲目选择。仿真验证了方法的可行性和有效性。  相似文献   

5.
学习控制的现状与展望   总被引:25,自引:1,他引:25  
在此我们综述学习控制理论的发展历程.首先给出基于可重复性的学习控制的基本概念与原理.然后简述学习控制的两大主流---迭代学习控制和反复控制.接着对当今迭代学习控制理论前沿的几大热点加以考察,并简要介绍学习控制理论和Lyapunov方法的结合.最后讨论学习控制理论的新发展方向.  相似文献   

6.
王常虹  张福恩 《机器人》1992,14(3):5-10
本文通过对迭代学习控制机理的分析,提出了一种新的迭代学习控制方法.根据 Banach 不动点定理和高增益反馈原理,给出了这种方法的稳定条件,证明了这种学习控制器的设计问题可以转化为反馈控制器的设计问题.文中讨论了这种方法在机器人控制中的应用问题,给出了对三自由度机器人的仿真结果.  相似文献   

7.
本文将学习控制和神经网络方法结合起来,既避免了前者对重复性的要求,又避免了后者对于快速系统实时的控制的困难,将其应用于对液压转台中偏载干扰的抑制,取得了良好的仿真结果。  相似文献   

8.
针对基于迭代学习控制的交通信号控制方法对于路网中存在的非重复性实时干扰不能进行有效处理的问题,本文在基于迭代学习控制的交通信号控制方法基础上,结合模型预测控制滚动优化和实时校正的特点,提出了一种基于迭代学习与模型预测控制的交通信号混合控制方法.该方法在有效利用交通流周期性特征改善路网交通状况的同时,可借助模型预测控制的优点对非重复性的实时干扰进行处理,从而进一步提高交通信号的控制效率.通过仿真实验对该方法的有效性进行了验证.实验结果表明,基于迭代学习与模型预测控制的交通信号混合控制方法能够更有效地均衡路网内的车辆密度,进一步提高了路网的通行效率.最后,本文还对该方法的收敛性进行了分析.  相似文献   

9.
非线性系统的迭代学习控制及其算法实现   总被引:7,自引:1,他引:7       下载免费PDF全文
研究了非线性系统的学习控制方法. 首先, 对学习控制方法在目前发展中所存在的一些问题进行了分析; 在此基础上, 通过引进新的(λ,ξ)范数及新的算法, 克服了这一理论研究中所存在的一些困难, 避免了以上问题的出现, 获得了控制算法全局收敛和目标跟踪精度较高的结果. 而且对所给算法的可实现性问题进行了分析.  相似文献   

10.
介绍输出概率密度函数(PDF)常规的迭代学习控制(ILC)的收敛条件,并利用此条件设计相应的迭代学习律。主要讨论如何解决输出PDF迭代学习控制(ILC)中的过迭代,收敛速度等问题。以离散输出概率密度函数(PDF)控制模型为基础,介绍了直接迭代学习控制算法收敛的必要条件,提出自适应的迭代学习参数调节方法和避免过迭代的迭代结束条件,这些措施能够保证输出PDF的迭代控制收敛且具有较快的收敛速度。仿真结果表明,输出PDF的自适应迭代学习控制具有较快的收敛速度,而学习终止条件能很好地避免过迭代。  相似文献   

11.
利用H∞范数对异步自学习控制系统进行了深入的研究.基于用H∞语言重新改写的问 题提法,给出了四个引理与一个定理的严格证明,得到了渐近稳定时控制器存在的一个充分条 件,并给出了计算实例.  相似文献   

12.
异步自学习控制的频域稳定性分析   总被引:1,自引:0,他引:1  
本文首先研究了一般频域形式的异步自学习控制系统的稳定性,然后基于渐消记忆和Ek+1(s)反馈,得到了一种稳定域更宽的重要变形,并证明了有关的定理一推论,给出了学习矩阵与稳定圆的几何关系,文中还进一步利用DNA法,得到一个渐近稳定条件,给出若干结论。  相似文献   

13.
In this paper, the stability of iterative learning control with data dropouts is discussed. By the super vector formulation, an iterative learning control (ILC) system with data dropouts can be modeled as an asynchronous dynamical system with rate constraints on events in the iteration domain. The stability condition is provided in the form of linear matrix inequalities (LMIS) depending on the stability of asynchronous dynamical systems. The analysis is supported by simulations.  相似文献   

14.
本文针对非线性多阶段间歇过程在切换瞬间存在异步切换的问题,提出了一种鲁棒模糊预测异步切换控制方法.该方法将非线性多阶段间歇过程表示为同步子系统和异步子系统的等效闭环扩展Takagi-Sugeno模糊模型,在此基础上给出了确保每个批次指数稳定和每个阶段渐近稳定的,基于线性矩阵不等式的稳定性条件以及不同情况运行时间的计算方法.根据运行时间采用超前切换思想,避免异步切换情况的出现,保证系统的稳定运行.仿真案例表明所设计的控制器是有效的和可行的.  相似文献   

15.
This paper adopts a reinforcement learning control using frequency domain method for a SISO system with friction and input-saturation process. Based on the two-dimensional system theory, the proposed method investigates the robust stability criteria of the SISO iterative learning control system (ILCS) using frequency domain methods. The restrictive conditions for the stability of the ILCS are also derived. A design procedure for the ILCS is outlined. A numerical simulation example is given to demonstrate the utilization of obtained results.  相似文献   

16.
As a powerful tool for solving nonlinear complex system control problems, the model-free reinforcement learning hardly guarantees system stability in the early stage of learning, especially with high complicity learning components applied. In this paper, a reinforcement learning framework imitating many cognitive mechanisms of brain such as attention, competition, and integration is proposed to realize sample-efficient self-stabilized online learning control. Inspired by the generation of consciousness in human brain, multiple actors that work either competitively for best interaction results or cooperatively for more accurate modeling and predictions were applied. A deep reinforcement learning implementation for challenging control tasks and a real-time control implementation of the proposed framework are respectively given to demonstrate the high sample efficiency and the capability of maintaining system stability in the online learning process without requiring an initial admissible control.  相似文献   

17.
《国际计算机数学杂志》2012,89(11):1339-1353
This paper adopts a reinforcement learning control using the frequency domain method for a SISO system with friction and input saturation process. The proposed method, which is based on two-dimensional system theory, investigates the robust stability criteria of the SISO iterative learning control system ({ILCS}) using frequency domain methods. The restrictive conditions for the stability of the {ILCS} are also derived. A design procedure for the {ILCS} is outlined. A numerical simulation example is given to demonstrate the utilization of obtained results.  相似文献   

18.
具有长时延及丢包的网络控制系统稳定性分析   总被引:3,自引:0,他引:3       下载免费PDF全文
研究了同时具有大于一个采样周期的随机传输时延及数据包丢失的网络控制系统的稳定性问题.对于给定的数据包丢失率,网络控制系统被建模为具有两个事件速率约束的异步动态系统,利用异步动态系统理论给出了网络控制系统指数稳定的充分条件,状态反馈控制器可通过解一组矩阵不等式求出.仿真示例验证了所提出方法的有效性.  相似文献   

19.
针对一类时变切换系统,当考虑子系统具有分数阶(Fractional Order)特性时,提出了一种基于模型依赖平均驻留时间方法的有限时间稳定性条件及异步切换控制策略.借助于Caputo分数阶导数引理和切换Lyapunov函数,利用矩阵不等式技术提出了分数阶时变切换系统有限时间稳定的充分条件.将有限时间稳定的结果进一步推广到有限时间有界的情形,利用平均驻留时间思想提出了分数阶时变切换系统有限时间有界的充分条件,基于该条件设计了系统的异步切换控制器.所给出的设计方法将系统异步切换控制问题转化为矩阵不等式组的求解问题.通过数值仿真验证了所提控制方法的有效性.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号