期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张航罗大庸黄浩江罗熊《自动化技术与应用》2002,52(2):3-5,32

在机器人的轨迹跟踪的迭代学习控制中，迭代学习的学习律难以选择，本文结合自校正控制、模糊逻辑和迭代学习控制的基本思想，提出采用自适应模糊控制确定学习效率的方法，并采用Matlab软件的Simulink对该方法应用于机器人高精度的轨迹跟踪控制的情况进行了仿真研究，结果表明该方法具有学习控制律简单实用、跟踪精度高、学习速度快、鲁棒性强等优点。相似文献

2.

大射电望远镜轨迹跟踪模糊学习控制

苏玉鑫段宝岩彭勃南仁东《自动化学报》2002,28(6):1039-1042

1　引言“新一代大射电望远镜光机电一体化设计”[1～ 4 ]创新设计方案中 ,大跨度悬索拖动装有Stewart平台的馈源舱提供较大的工作空间 ,并实现馈源轨迹的粗调控制 ,Stewart精调平台在粗调的基础上实现馈源轨迹跟踪的精调控制 ,满足馈源轨迹跟踪精度要求 .馈源轨迹跟踪控制过程相似文献

3.

基于在线轨迹规划的桥式起重机定位消摆控制

范波张炜炜廖志明《控制工程》2020,27(9):1538-1544

相似文献

4.

在线学习与控制

马建国吕玉康《小型微型计算机系统》1991,12(7):57-60,F003

如何构造智能控制系统?怎样分析抽取实际生产过程的特点和模型进而建立相应的数据结构及知识库?这些问题本文结合一设计实例进行了探讨.由于引进了一定的学习功能,便设计的智能控制系统能够根据生产实际中的控制效果随时修改知识库中的控制规则,以实现生产的优化控制. 相似文献

5.

机械手轨迹跟踪的自学习控制

周其节张文红《自动化与仪器仪表》1992,(1):13-17

相似文献

6.

基于学习方法的机器人轨迹控制的实现

韦巍蒋静坪《机器人》1993,(5)

本文针对机器人周期性重复劳动的运动轨迹控制,提出了一种基于 PID 调节器型的学习控制方法.本文首先给出了线性时变系统学习控制方法的稳定性条件,并导出了非线性机器人系统的迭代学习方法.此方法结构简单,计算量小,便于实时控制.最后就 PUMA-560的前三关节机械手的轨迹控制作了仿真研究.结果表明,随着学习次数的增加,机械手的实际运动轨迹将收敛于期望轨迹. 相似文献

7.

基于增强型算法并能自动生成规则的模糊神经网络控制器

吴耿锋傅忠谦《控制理论与应用》2001,18(2):241-244

给出了一种基于增强型算法并能自动生成控制规则的模糊神经网络控制器RBFNNC（reinforcements based fuzzy neural network comtroller）。该控制器能根据被控对象的状态通过增强型学习自动生成模糊控制规则,RBFNNC用于倒立摆小车平衡系统控制的仿真实验表明了该系统的结构及增强型学习算法是有效和成功的。相似文献

8.

基于强化学习的二级倒立摆控制

王瑞霞孙亮阮晓钢《计算机仿真》2006,23(4):305-308

在模型未知和没有先验经验的条件下，采用一种改进的强化学习算法实现二级倒立摆系统的平衡控制。该学习算法不需要预测和辨识模型，能通过网络自身的联想和记忆，在线寻求最优策略。该学习算法采用基于神经网络的值函数逼近，并用直接梯度和适合度轨迹修正权值，有效实现对连续状态和行为空间任务的控制。计算机仿真证明了该强化学习算法在较短的时间内即可成功地学会控制直线二级倒立摆系统。相似文献

9.

基于随机初态学习率的迭代学习控制

田丰乔景慧《工业控制计算机》2021,34(2):56-57,60

迭代学习算法广泛应用于机器人轨迹跟踪控制研究中.常规迭代学习算法要求每次迭代的初始条件都相同,针对一类强耦合非线性系统在有限时间内重复运动的特征,提出了一种带有任意初态学习率的迭代算法.这种算法允许迭代时初始状态处于任意位置,通过数学计算证明了系统在不同初始态条件下的迭代学习算法,系统输出可以完全跟踪期望轨迹.这种带有... 相似文献

10.

基于迭代学习控制的移动机器人轨迹跟踪控制

裴九芳王海许德章《计算机工程与应用》2012,48(9):222-225

为提高移动机器人对特定轨迹的重复跟踪能力,提出了采用开闭环PD型迭代学习控制算法对移动机器人进行轨迹跟踪控制的方法。建立了包含外界干扰的非完整约束条件下的轮式移动机器人运动学模型,给出了系统的控制算法和控制结构。仿真结果表明,采用开闭环PD型迭代学习控制算法对轨迹跟踪是可行有效的,收敛速度优于其他迭代学习算法。相似文献

11.

再励学习在卫星姿态控制中的仿真研究

崔晓婷刘向东张宇河《计算机仿真》2006,23(10):19-22

为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,即可以在不需要被控卫星的精确数学模型的前提下解决网络参数在线调整的问题,又可以在无需训练样本的前提下实现控制器的在线学习。最后同传统PID控制相比的仿真结果表明,基于再励学习的三轴稳定卫星姿态控制系统不仅可以达到卫星姿态控制任务对控制精度的要求,还可以有效地克服干扰,从而达到了在线学习的目的。相似文献

12.

Concepts and Facilities of a Neural Reinforcement Learning Control Architecture for Technical Process Control

M Riedmiller 《Neural computing & applications》1999,8(4):323-338

The paper presents the concepts of a neural control architecture that is able to learn high quality control behaviour in technical process control from scratch. As the input to the learning system, only the control target must be specified. In the first part of the article, the underlying theoretical principles of dynamic programming methods are explained, and their adaptation to the context of technical process control is described. The second part discusses the basic capabilities of the learning system on a typical benchmark problem, where a special focus lies on the quality of the acquired control law. The application to a highly nonlinear chemical reactor and to an instable multi-output system shows the ability of the proposed neural control architecture to learn even difficult control strategies from scratch. 相似文献

13.

PD型模糊学习控制及其在可重复轨迹跟踪问题中的应用 总被引：1，自引：0，他引：1

许建新徐静曹文军《自动化学报》2001,27(4):434-446

针对可重复轨迹跟踪问题,提出了一种PD型模糊学习算法.该算法集成两种控制:作为基础的PD型模糊逻辑算法和改善系统性能的学习算法.模糊学习控制在模糊控制基础上引入迭代学习算法,使得模糊PD控制器可以精确地跟踪可重复轨迹以及消除周期性扰动.本文在能量函数和泛函分析的基础上,通过严格的推导表明PD型模糊学习算法可达到:1)系统跟踪误差一致收敛到零;2)学习控制序列几乎处处收敛到理想的控制信号. 相似文献

14.

分阶Dyna强化学习算法

赵昀陈庆伟胡维礼《计算机仿真》2009,26(7):154-158

针对现有Dyna强化学习体系结构下,"规划"和"学习"在计算资源分配上的不合理问题,提出了一种分阶Dyna体系结构,随着经验知识的不断积累,将学习过程划分为探索阶段、变比重学习阶段和优化阶段,分别进行"规划"和"学习"的协调控制,大大减少了计算资源的浪费.结合传统的Q-学习算法,设计了分阶Dyna-Q强化学习算法,以适应动态不确定环境下的任务.在一个标准强化学习问题中,验证了所设计的分阶Dyna强化学习算法比基本Dyna强化学习算法具有更好的学习性能. 相似文献

15.

基于因果建模的强化学习控制: 现状及展望

孙悦雯柳文章孙长银《自动化学报》2023,49(3):661-677

基于因果建模的强化学习技术在智能控制领域越来越受欢迎. 因果技术可以挖掘控制系统中的结构性因果知识, 并提供了一个可解释的框架, 允许人为对系统进行干预并对反馈进行分析. 量化干预的效果使智能体能够在复杂的情况下 (例如存在混杂因子或非平稳环境) 评估策略的性能, 提升算法的泛化性. 本文旨在探讨基于因果建模的强化学习控制技术 (以下简称因果强化学习) 的最新进展, 阐明其与控制系统各个模块的联系. 首先介绍了强化学习的基本概念和经典算法, 并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷. 其次, 回顾了因果理论的研究方向, 主要包括因果效应估计和因果关系发现, 这些内容为解决强化学习的缺陷提供了可行方案. 接下来, 阐释了如何利用因果理论改善强化学习系统的控制与决策, 总结了因果强化学习的四类研究方向及进展, 并整理了实际应用场景. 最后, 对全文进行总结, 指出了因果强化学习的缺点和待解决问题, 并展望了未来的研究方向. 相似文献

16.

基于强化学习和模糊逻辑的移动机器人导航

卓睿陈宗海陈春林《计算机仿真》2005,22(8):157-162

自主导航是移动机器人的一项关键技术。该文采用强化学习结合模糊逻辑的方法实现了未知环境下自主式移动机机器人的导航控制。文中首先介绍了强化学习原理,然后设计了一种未知环境下机器人导航框架。该框架由避碰模块、寻找目标模块和行为选择模块组成。针对该框架,提出了一种基于强化学习和模糊逻辑的学习、规划算法：在对避碰和寻找目标行为进行独立学习后,利用超声波传感器得到的环境信息进行行为选择,使机器人在成功避碰的同时到达目标点。最后通过大量的仿真实验,证明了算法的有效性。相似文献

17.

造船龙门起重机大车纠偏控制系统的设计与应用

王吉明《自动化博览》2014,(5):96-99

造船龙门起重机随着造船业的迅速发展也跟着快速发展起来。在大车行走过程中,由于龙门起重机的刚腿和柔腿之间的跨距较大,因此要求刚腿和柔腿的位移要始终保持一致,如果偏差过大则会造成大车偏斜运行等严重后果。本文结合软硬件的设计,详细介绍了大车纠偏控制系统从位置检测到位置闭环控制是如何实现大车的实时纠偏。相似文献

18.

Bio-insect and artificial robot interaction using cooperative reinforcement learning

《Applied Soft Computing》2014

In this paper, we propose fuzzy logic-based cooperative reinforcement learning for sharing knowledge among autonomous robots. The ultimate goal of this paper is to entice bio-insects towards desired goal areas using artificial robots without any human aid. To achieve this goal, we found an interaction mechanism using a specific odor source and performed simulations and experiments [1]. For efficient learning without human aid, we employ cooperative reinforcement learning in multi-agent domain. Additionally, we design a fuzzy logic-based expertise measurement system to enhance the learning ability. This structure enables the artificial robots to share knowledge while evaluating and measuring the performance of each robot. Through numerous experiments, the performance of the proposed learning algorithms is evaluated. 相似文献

19.

A New Adaptive Neuro-sliding Mode Control for Gantry Crane

Slim Frikha Mohamed Djemel Nabil Derbel 《International Journal of Control, Automation and Systems》2018,16(2):559-565

This paper presents a new adaptive neuro-sliding mode control for gantry crane as varying rope length. This control method derived from combining the sliding surfaces of three subsystem of the gantry crane (trolley position, rope length, anti-swing) to draw out two system sliding surfaces: the trolley position with the anti-swing and the rope length and the anti-swing. On the based of the sliding mode control principle, drawn out the equivalent controller and the switching controller for gantry crane. But due to the uncertain parameters-nonlinear model of gantry crane with the bound disturbances, combining the neural approximate method, defined the neural controller and the compensation controller for the difference between the equivalent controller and the neural controller for two system control inputs: trolley position and rope length. The adaptive control laws for these controllers were deduced from Lyapunov’s stable criteria to asymptotically stabilize the sliding surfaces. Simulation studies are performed to illustrate the effectiveness of the proposed control. 相似文献

20.

氧乐果合成过程温度模糊预测学习控制研究

李玮冯冬青费敏锐《自动化仪表》2007,28(11):4-7

根据氧乐果合成反应过程分批重复进行且温度控制对象参数时变、时滞后的特点,将迭代学习控制方法应用于氧乐果合成反应过程温度控制。为了消除滞后产生的影响,采用T-S模糊预测模型,在原有反馈-前馈迭代学习算法基础上引入预测思想,研究了基于模糊预测的迭代学习算法,并设计了氧乐果合成过程温度模糊预测学习控制器。实验和仿真结果表明,该控制器能取得比较满意的控制效果。相似文献