首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。  相似文献   

2.
竞争式Takagi-Sugeno模糊再励学习   总被引:4,自引:0,他引:4  
针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络(CTSFRLN),该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法.文中相应提出了两种学习算法,即竞争式Takagi-Sugeno模糊Q-学习算法和竞争式Takagi-Sugeno模糊优胜学习算法,其把CTSFRLN训练成为一种所谓的Takagi-Sugeno模糊变结构控制器.以二级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法.  相似文献   

3.
研究了一种带有的CMAC神经网络的再励学习(RL)控制方法,以解决具有高度非线性的系统控制问题。研究的重点在于算法的简化以及具有连续输出的函数学习上。控制策略由两部分构成;再励学习控制器和固定增益常规控制器。前者用于学习系统的非线性,后者用于稳定系统。仿真结果表明,所提出的控制策略不仅是有效的,而且具有很高的控制精度。  相似文献   

4.
张华军  赵金 《计算机工程》2010,36(1):18-20,2
提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关系,用预测网络逼近最优解的能力引导遗传算法在局部向最优解快速逼近,以解决遗传算法局部振荡问题,从而实现快速学习的能力。将其应用于矢量控制交流电机的速度环控制器自学习中,仿真实验验证了该算法的有效性。  相似文献   

5.
滕振宇  武妍 《计算机工程》2003,29(20):63-65
提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案,解决了多控制目标下列车控制问题,确保了列车准确运行。仿真取得了令人满意的结果。结果表明,这种将模糊控制和再励学习相结合的智能控制方法综合用于列车运行控制是可行的,可以较好地保证舒适性、停车准确性和正点性。  相似文献   

6.
基于再励学习与遗传算法的交通信号自组织控制   总被引:17,自引:1,他引:16  
提出一种基于再励学习和遗传算法的交通信号自组织控制方法.再励学习针对每一个道路交叉口交通流的优化,修正每个信号灯周期的绿信比.遗传算法则产生局部学习过程的全局优化标准,修正信号灯周期的大小.这种方法将局部优化和全局优化统一起来,克服了现有的控制方法需要大量数据传输通讯、准确的交通模型等缺陷.  相似文献   

7.
本文介绍了Agent组织规则及再励学习的理论,给出了一种基于再励学习的Agem组织规则生成机制和相应的算法。从而得出结论:Agent组织规则在求解过程中起着重要的作用,可以有效地减少冲突,提高求解效率。  相似文献   

8.
联盟形成的收益值是模糊和不确定的,难于计算,而联盟收益值在成员变化的情况下的计算就更为复杂。Lerman等人实现了动态联盟Agent进出联盟的管理方法,Chalkiadakis则研究了不确定情况下联盟的再励学习,但没有涉及联盟成员变化情况下的收益值动态性。论文定义了带折扣率的估计核,给出一种再励学习算法来计算联盟成员变化后的收益值,深化了Chalkiadakis的工作。实验结果验证了该方法的可行性和正确性。  相似文献   

9.
基于T-S模糊再励学习的稳定双足步态生成算法   总被引:2,自引:0,他引:2  
胡凌云  孙增圻 《机器人》2004,26(5):461-466
提出了一种基于T S模糊再励学习的稳定双足步态生成算法 .将再励学习引入T S模糊神经网学习增益参数 ,从而采用较少的模糊规则充分逼近了由ZMP曲线到髋关节轨迹的非线性变化关系 ,并将连续空间的多变量变化转换为一维独立动作增益的并行搜索 .仿真结果和双足机器人Luna的实验数据都验证了算法的可行性 .  相似文献   

10.
基于再励学习的主动队列管理算法   总被引:6,自引:0,他引:6       下载免费PDF全文
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性.  相似文献   

11.
韩伟  鲁霜 《计算机应用与软件》2011,28(11):96-98,107
以电子市场智能定价问题为研究背景,提出基于模糊推理的多智能体强化学习算法(FI-MARL).在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则.该方法有效融合应用背景的领域知识,充分利用样本信息并降低学习空间维数,从而增强在线学习性能.在电子市场定价的...  相似文献   

12.
非线性系统的神经网络学习控制   总被引:2,自引:0,他引:2  
主要控制了一类非线性系统的神经网络学习控制问题。讨论了以迭代学习方式训练的神经网络学习控制器,在满足一定条件,可以实现一定时间内的系统输出跟踪。  相似文献   

13.
基于TS模糊神经网络的Fuzzy规则自动获取研究   总被引:1,自引:0,他引:1  
Fuzzy规则的获取一直是模糊智能系统的一个瓶颈。醉在深入研究TS模糊神经网络的物理意义的基础上,给出了使用遗传算法优化模糊规则集的算法并提出了从训练后的TS模糊神经网络中抽取Fuzzy规则的可操作方法。分析和实验证明,这种方法可以实现且是有效的,对于Fuzzy规则自动获取的研究具有积极的借鉴意义。  相似文献   

14.
强化学习方法是人工智能领域中比较重要的方法之一,自从其提出以来已经有了很大的发展,并且能用来解决很多的问题。但是在遇到大规模状态空间问题时,使用普通的强化学习方法就会产生“维数灾”现象,所以提出了关系强化学习,把强化学习应用到关系领域可以在一定的程度上解决“维数灾”难题。在此基础上,简单介绍关系强化学习的概念以及相关的算法,以及以后有待解决的问题。  相似文献   

15.
基于神经网络的强化学习算法研究   总被引:11,自引:0,他引:11  
BP神经网络在非线性控制系统中被广泛运用,但作为有导师监督的学习算法,要求批量提供输入输出对神经网络训练,而在一些并不知道最优策略的系统中,这样的输入输出对事先并无法得到,另一方面,强化学习从实际系统学习经验来调整策略,并且是一个逼近最优策略的过程,学习过程并不需要导师的监督。提出了将强化学习与BP神经网络结合的学习算法-RBP模型。该模型的基本思想是通过强化学习控制策略,经过一定周期的学习后再用学到的知识训练神经网络,以使网络逐步收敛到最优状态。最后通过实验验证了该方法的有效性及收敛性。  相似文献   

16.
单体模糊神经网络的学习规则及其收敛性研究   总被引:6,自引:0,他引:6  
兴久祯教授在不久前研究了单体模糊神经网络(MFNNs)的函数逼近能力,在此基础上,提出了单体模糊神经网络(MFNNs)的学习规则并进一步研究了其收敛性,研究结果表明,所提出的学习规则百收敛的,这一结论为单体模糊神经网络的应用提供了坚实的理论基础。  相似文献   

17.
模糊本体是语义网中处理模糊信息的重要工具,而模糊本体学习是构建模糊本体的一种有效方法,因此模糊本体学习已逐渐成为现今本体研究的热点。作为模糊本体的另一种图结构的表现形式,模糊概念格构造与演化的研究也渐渐引起人们的关注。模糊形式概念分析是一种基于模糊形式背景表示形式概念的新模型,是由模糊集理论与形式概念分析结合而成,其主要表现形式即是模糊概念格。这种模糊概念层次结构是数据分析及规则提取的有效工具,且支持概念间相似度的计算。提出一种基于模糊形式概念分析的模糊本体学习方法,意图从领域文档中获取模糊概念和模糊概念关系,并通过模糊形式概念分析,将其添加到源模糊本体转化的模糊概念格中,以完成模糊本体学习。  相似文献   

18.
并行遗传算法与神经网络,模糊系统的结合   总被引:2,自引:0,他引:2  
遗传算法是模拟自然界生物进化过程的计算模型。本文介绍了并行遗传算法的不同分类及不同并行策略,又将遗传算法分别与神经网络、模糊系统结合起来进行并行处理,并在曙光1000系统上实现。算法分析表明,并行遗传算法可以有效地提高收敛速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号