首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
竞争式Takagi-Sugeno模糊再励学习   总被引:4,自引:0,他引:4  
针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络 (CTSFRLN),该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再 励学习方法.文中相应提出了两种学习算法,即竞争式Takagi-Sugeno模糊Q-学习算法和竞争 式Takagi-Sugeno模糊优胜学习算法,其把CTSFRLN训练成为一种所谓的Takagi-Sugeno模 糊变结构控制器.以二级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于 其它的再励学习算法.  相似文献   

2.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。  相似文献   

3.
基于T-S模糊再励学习的稳定双足步态生成算法   总被引:2,自引:0,他引:2  
胡凌云  孙增圻 《机器人》2004,26(5):461-466
提出了一种基于T S模糊再励学习的稳定双足步态生成算法 .将再励学习引入T S模糊神经网学习增益参数 ,从而采用较少的模糊规则充分逼近了由ZMP曲线到髋关节轨迹的非线性变化关系 ,并将连续空间的多变量变化转换为一维独立动作增益的并行搜索 .仿真结果和双足机器人Luna的实验数据都验证了算法的可行性 .  相似文献   

4.
针对一类非线性系统,提出一种基于再励学习的自组织模糊CPN的稳定控制系统。控制结构中采用滑模控制使状态到达设计的切换面,保证系统稳定;用基于再励学习的自组织模糊CPN 作为补偿控制器减弱系统不确定部分的影响。仿真实例表明了所给算法的有效性。  相似文献   

5.
马勇  许晓鸣 《控制与决策》1999,14(11):549-552
针对一类非线性系统,提出一种基于再励学习的自组织模糊CPN的稳定控制系统。控制结构中采用滑模控制使状态到达设计的切换面,保证系统稳定,用基于再励学习的自组织模糊CPN作为补偿控制器减弱系统不确定部分的影响。仿真实例表明了所给算法的有效性。  相似文献   

6.
基于再励学习蚁群算法的多约束QoS路由方法   总被引:7,自引:1,他引:7  
本文研究了多约束QoS路由问题,给出基于模糊评判的路由模型,实现了多QoS约束的综合优化;同时提出一种再励学习蚁群路由算法对该问题进行求解,算法通过对蚂蚁搜索路径进行评价产生再励信号,并根据再励信号采取了不同的信息素更新策略,提高了算法的寻优能力和收敛速度。仿真实验表明,该算法能快速得到较大程度满足业务QoS要求的路径。  相似文献   

7.
本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法,文中还给出了再励学习系统中模糊自适应控制器的网络结构及其有关算法的改进。仿真结果表明:本文提出的控制方法对具有时滞的不确定系统的自学习控制不仅是有效的,而且具有良好的鲁棒性。  相似文献   

8.
一种新的复杂系统模糊辨识方法   总被引:5,自引:0,他引:5  
针对一阶Takagi-Sugeno模型辨识复杂系统的困难,提出一种新的模糊模型.这种模 型的结构在一阶Takagi-Sugeno模型的基础上,再进行一次非线性映射.文中运用卡尔曼滤 波算法的模糊神经元网络实现了这种模型.仿真结果表明该方法辨识精度高,且有良好的 实用性.  相似文献   

9.
讨论了采用无监督的模糊竞争学习算法,并结合自组织竞争网络构成的一种新型模糊聚类神经网络模型,提出了一种基于该网络模型的镜头突变检测算法。该算法通过对线性特征空间进行由粗到细的两步模糊聚类实现镜头突变的检测。实验结果表明该算法是可行和有效的。  相似文献   

10.
基于再励学习的主动队列管理算法   总被引:6,自引:0,他引:6       下载免费PDF全文
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性.  相似文献   

11.
提出了一种基于T-S模型的模糊预测控制策略。T-S模糊模型用来描述对象的非线性动态特性,通过当前的工况参数实时在线的修正每一时刻的阶跃响应模型参数,将模糊模型作为常规线性预测控制DMC方法的预测模型,从而把T-S模型对复杂的非线性系统的良好描述特性和预测控制的滚动优化算法相结合,来实现利用常规线性预测控制策略对非线性系统的有效控制,有效地解决了复杂工业过程的强非线性问题。pH中和过程的仿真结果表明其性能明显优于传统的PID控制器。  相似文献   

12.
基于遗传算法的模糊神经网络股市建模与预测   总被引:12,自引:1,他引:12  
提出一种基于模糊神经网络的股票市场建模与预测方法,并采用遗传算法训练网络权值及模糊子集的划分,对于上证指数及个股的建模与预测结果表明,该方法具有很强的学习与泛化能力,在处理诸如股票市场上这种具有一定程度不确定性的非互性的建模与预测方面有很发的价值。  相似文献   

13.
在利用T-S模糊模型对未知函数逼近的基础上,针对一类含未知非线性函数和外界干扰的复杂系统,设计一种直接鲁棒自适应模糊控制器。此控制器学习参数只有一个,工程技术上容易实现。通过对达芬强迫振荡系统仿真,验证了该方案的有效性。  相似文献   

14.
This paper proposes a reinforcement fuzzy adaptive learning control network (RFALCON), constructed by integrating two fuzzy adaptive learning control networks (FALCON), each of which has a feedforward multilayer network and is developed for the realization of a fuzzy controller. One FALCON performs as a critic network (fuzzy predictor), the other as an action network (fuzzy controller). Using temporal difference prediction, the critic network can predict the external reinforcement signal and provide a more informative internal reinforcement signal to the action network. The action network performs a stochastic exploratory algorithm to adapt itself according to the internal reinforcement signal. An ART-based reinforcement structure/parameter-learning algorithm is developed for constructing the RFALCON dynamically. During the learning process, structure and parameter learning are performed simultaneously. RFALCON can construct a fuzzy control system through a reward/penalty signal. It has two important features; it reduces the combinatorial demands of system adaptive linearization, and it is highly autonomous.  相似文献   

15.
This paper proposes a three-layered parallel fuzzy inference model called reinforcement fuzzy neural network with distributed prediction scheme (RFNN-DPS), which performs reinforcement learning with a novel distributed prediction scheme. In RFNN-DPS, an additional predictor for predicting the external reinforcement signal is not necessary, and the internal reinforcement information is distributed into fuzzy rules (rule nodes). Therefore, using RFNN-DPS, only one network is needed to construct a fuzzy logic system with the abilities of parallel inference and reinforcement learning. Basically, the information for prediction in RFNN-DPS is composed of credit values stored in fuzzy rule nodes, where each node holds a credit vector to represent the reliability of the corresponding fuzzy rule. The credit values are not only accessed for predicting external reinforcement signals, but also provide a more profitable internal reinforcement signal to each fuzzy rule itself. RFNN-DPS performs a credit-based exploratory algorithm to adjust its internal status according to the internal reinforcement signal. During learning, the RFNN-DPS network is constructed by a single-step or multistep reinforcement learning algorithm based on the ART concept. According to our experimental results, RFNN-DPS shows the advantages of simple network structure, fast learning speed, and explicit representation of rule reliability.  相似文献   

16.
基于自适应模糊网络的在线辨识   总被引:4,自引:4,他引:0  
喻英  阮学斌 《控制工程》2005,12(5):426-428,435
研究了基于一阶Sugeno的自适应网络模糊推理系统(ANFIS)进行在线辨识的方法。给出了该自适应网络的结构,在此基础上给出了网络权值的修正算法,即综合最陡下降法和最小二乘法得到的一种混合学习算法。对一个非线性模型进行了数字仿真,得到的在线辨识的结果优于采用反传算法的普通神经网络辨识方法。由此证明,一阶Sugeno模糊推理模型和混合学习算法的采用,使得该辨识方法具备网络结构简单、收敛速度快的优势,便于工程实现。  相似文献   

17.
This paper proposes a transformation method that serves the trade‐off between the modelling complexity and accuracy of multi‐variable Takagi‐Sugeno fuzzy inference operator‐based modelling (TS fuzzy modelling). The relation between the number of fuzzy rules and the modelling accuracy is defined in the paper. The proposed transformation method is capable of finding the minimal number of fuzzy rules for a given accuracy of a given TS fuzzy model. A case study, focusing on a benchmark problem of fault diagnosis, developed in the framework of EC‐founded Research Training Network DAMADICS, of an actuator in a sugar factory, is presented to provide feasibility of the proposed method.  相似文献   

18.
一种基于Rough Sets和模糊神经网络的规则获取的方法   总被引:3,自引:1,他引:2  
该文提出了一种基于RoughSets思想获取初始规则,并通过模糊神经网络优化,最后再进行简化获取模糊规则,及模糊系统参数学习的方法。并通过实例进行了自动列车运行系统仿真。文中还基于上述实例,将这种基于模糊神经网络的学习与控制方法与标准的BP网络和基本的模糊系统方法进行了比较,并总结了这种方法的特点。结论表明,该文所提出的模糊规则生成和模糊系统学习方法是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号