首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 146 毫秒
1.
研究了一种带有的CMAC神经网络的再励学习(RL)控制方法,以解决具有高度非线性的系统控制问题。研究的重点在于算法的简化以及具有连续输出的函数学习上。控制策略由两部分构成;再励学习控制器和固定增益常规控制器。前者用于学习系统的非线性,后者用于稳定系统。仿真结果表明,所提出的控制策略不仅是有效的,而且具有很高的控制精度。  相似文献   

2.
再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学习系统中,通常用于解决预测和控制两类问题。提出了以矢量形式表示的评估函数,为了实现多维再励学习,用一专门的神经网络(Q网络)实现评判网络,研究其在移动机器人行为规划中的应用。  相似文献   

3.
张华军  赵金 《计算机工程》2010,36(1):18-20,2
提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关系,用预测网络逼近最优解的能力引导遗传算法在局部向最优解快速逼近,以解决遗传算法局部振荡问题,从而实现快速学习的能力。将其应用于矢量控制交流电机的速度环控制器自学习中,仿真实验验证了该算法的有效性。  相似文献   

4.
马勇  许晓鸣 《控制与决策》1999,14(11):549-552
针对一类非线性系统,提出一种基于再励学习的自组织模糊CPN的稳定控制系统。控制结构中采用滑模控制使状态到达设计的切换面,保证系统稳定,用基于再励学习的自组织模糊CPN作为补偿控制器减弱系统不确定部分的影响。仿真实例表明了所给算法的有效性。  相似文献   

5.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。  相似文献   

6.
为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,即可以在不需要被控卫星的精确数学模型的前提下解决网络参数在线调整的问题,又可以在无需训练样本的前提下实现控制器的在线学习。最后同传统PID控制相比的仿真结果表明,基于再励学习的三轴稳定卫星姿态控制系统不仅可以达到卫星姿态控制任务对控制精度的要求,还可以有效地克服干扰,从而达到了在线学习的目的。  相似文献   

7.
基于再励学习与遗传算法的交通信号自组织控制   总被引:16,自引:1,他引:16  
提出一种基于再励学习和遗传算法的交通信号自组织控制方法.再励学习针对每一个 道路交叉口交通流的优化,修正每个信号灯周期的绿信比.遗传算法则产生局部学习过程的全 局优化标准,修正信号灯周期的大小.这种方法将局部优化和全局优化统一起来,克服了现有的 控制方法需要大量数据传输通讯、准确的交通模型等缺陷.  相似文献   

8.
针对列控系统难以建立精确的动力学模型问题,利用列车运行过程中包含的大量重复信息,选用迭代学习算法对列车动力学模型中的未知参数进行辨识并提出基于迭代学习控制的列车自动运行控制算法。算法核心是利用历史数据生成新的控制量控制列车自动运行。仿真结果表明,经过一定次数的迭代,参数辨识值保持稳定并且列车能够严格跟踪目标曲线行驶,保证列车高精度、高平稳、高安全的运行。  相似文献   

9.
再励学习——原理,算法及其在智能控制中的应用   总被引:20,自引:0,他引:20  
综述了再励学习的原理,主要算法,基于神经网络的实现及其在智能控制中的作用,探讨了应进一步研究的问题。  相似文献   

10.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。  相似文献   

11.
本文针对非线性多阶段间歇过程在切换瞬间存在异步切换的问题,提出了一种鲁棒模糊预测异步切换控制方法.该方法将非线性多阶段间歇过程表示为同步子系统和异步子系统的等效闭环扩展Takagi-Sugeno模糊模型,在此基础上给出了确保每个批次指数稳定和每个阶段渐近稳定的,基于线性矩阵不等式的稳定性条件以及不同情况运行时间的计算方法.根据运行时间采用超前切换思想,避免异步切换情况的出现,保证系统的稳定运行.仿真案例表明所设计的控制器是有效的和可行的.  相似文献   

12.
将两种不同的模糊神经网络分别应用于地铁列车控制中的站间运行阶段和定位停车阶段,仿真取得了令人满意的结果。为了降低控制系统的复杂度,提高系统的泛化能力,采用了在误差函数中引入正则项的方法。同时采用了基于扩展的自适应神经-模糊推理系统(简称ANFIS)获取模糊规则数和训练隶属度函数中心和宽度的方法。实验结果表明,将以上方法应用于地铁列车运行控制是可行的,可以保证较好的舒适性、速度跟随性和停车准确性。  相似文献   

13.
为了提高列控系统(列车运行控制系统,简称列控,是保证列车安全、快速运行的系统)测试的可靠性,生成合理的测试用例,需要设计相应的运行剖面来仿真实际使用的列控系统的情况,并且基于得到的运行剖面来生成相应的测试用例。因此,通过对列控中心系统的输入输出特点以及功能需求的研究与总结,提出了通过构建任务剖面、系统模式剖面、环境剖面来最终完成列控系统运行剖面构建的方法,并在最终得到的运行剖面基础上,应用优先级度量机制和程序插桩方法对粒子群算法进行合理改进,最终实现了测试用例的自动生成。实验结果证明,通过合理地构建运行剖面,可以保证测试功能的完整性以及测试数据的合理性,改进后的粒子群算法能够进一步提高测试的时间效率。  相似文献   

14.
高速列车速度跟踪控制系统是一个复杂的非线性系统,难以取得高精度的跟踪性能。为了减少速度跟踪误差,设计了高速列车神经网络PID控制器。首先建立了描述列车运行过程的单位移多质点模型,该模型考虑了列车的基本阻力和附加阻力以及车厢之间的相互作用力。然后阐述了BP神经网络PID控制,并设计了列车速度跟踪控制器,根据速度误差用神经网络PID控制决定牵引力和制动力。最后与模糊控制和常规PID控制进行了仿真对比,结果表明,神经网络PID控制具有很小的速度跟踪误差和优越的速度跟踪性能,可以满足列车正点运行的需求。  相似文献   

15.
为解决高速列车的快速、准确、舒适停车问题,分析并建立了列车制动的牵引力模型;综合考虑列车制动过程中舒适度因素的影响,提出了带有舒适度约束条件的模糊预测-PID复合控制方法。该控制方法结合了模糊预测控制以及模糊PID控制的优点,使列车制动过程的控制没有死角,控制状况始终处于最优。在制动距离较大情况下采用模糊预测控制修正控制量,优化制动力,使制动过程满足舒适度要求;在距离较近的情况下,采用模糊PID实现列车的准确停车。仿真结果证明了该方法的可行性和有效性。  相似文献   

16.
随着世界各国经济的发展,城市规模和人口规模的扩大,城市交通变得更加拥堵,许多发达国家在多年前就着手研究如何使用轨道交通解决城市的拥堵问题,地铁已成为当今城市交通的重要组成部分,地铁列车在运营过程中如何保证其运行状态能够实时受到监控,靠的就是列车网络系统;文章介绍了海外某项目的 网络系统结构、硬件配置;阐述了列车级控制、牵引系统、车窗系统、辅助系统、制动系统、空调系统、烟火系统等子系统的关键控制功能,并对系统的故障诊断功能、PTU功能进行了介绍;本项目网络系统的设计符合预期,系统硬件的性能完全满足功能需求,系统软件的可靠性、稳定性达到了列车运行要求.  相似文献   

17.
Optimal trajectory planning of high-speed trains (HSTs) aims to obtain such speed curves that guarantee safety, punctuality, comfort and energy-saving of the train. In this paper, a new shrinking horizon model predictive control (MPC) algorithm is proposed to plan the optimal trajectories of HSTs using real-time traffic information. The nonlinear longitudinal dynamics of HSTs are used to predict the future behaviors of the train and describe variable slopes and variable speed limitations based on real-time traffic information. Then optimal trajectory planning of HSTs is formulated as the shrinking horizon optimal control problem with the consideration of safety, punctuality, comfort and energy consumption. According to the real-time position and running time of the train, the shrinking horizon is updated to ensure the recursive feasibility of the optimization problem. The optimal speed curve of the train is computed by online solving the optimization problem with the Radau Pseudo-spectral method (RPM). Simulation results demonstrate that the proposed method can satisfy the requirements of energy efficiency and punctuality of the train.  相似文献   

18.
为了研究高速列车主动悬架系统横向振动控制,将研究对象简化为二自由度1/4车悬挂模型,研究了高速列车车体的横移、侧滚为变量的列车悬挂控制系统,采用德国轨道谱作为列车的激励拟合。算法控制器选择方面,在PID控制和模糊控制的基础上,建立模糊PID控制,并建立了基于模糊PID控制的高速列车主动悬架横向振动控制系统,通过MATLAB仿真生成关系曲线,验证了模糊PID控制算法具有更好的控制效果。  相似文献   

19.
针对列控系统的安全性和实时性要求,基于CTCS-3级列控系统需求规范中等级转换场景建立C2级向C3级转换的UML(统一建模语言)模型和有色Petri网(CPN)模型,分析了影响列车安全运行和行车效率的因素,即转换时长和转换成功率,验证了该建模方法的有效性。验证结果表明,UML和CPN模型相结合的方法适合于列控系统需求规范的验证。搭建的等级转换模型能够满足系统实时性要求。在保证切换成功率的前提下,列车运行速度与切换时间成反比,速度越高,切换时间越短;列车速度越高,对系统实时性要求也越高。  相似文献   

20.
一种远程智能列车试风测试系统   总被引:1,自引:0,他引:1  
介绍一种远程智能列车试风测试系统。系统由工控机、可编程控制系统和CAN总线系统等构成,利用CAN总线系统实现远程数据测量和通信。智能CAN节点主要由带CAN控制器和A/D转换器的单片机PIC18F448构成。运用模糊控制算法调节试风风压。实际运行表明:该系统可靠高,达到测试精度要求,并实现完全自动化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号