首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
针对传统PID控制器无法在线自整定参数的不足,提出了一种基于执行器一评估器(Actor-Critic,AC)学习的自适应PID控制器结构与学习算法.该控制器利用AC学习实现PID参数的自适应整定,采用一个径向基函数网络同时对Actor的策略函数和Critic的值函数进行逼近.径向基函数网络的输入为系统误差、误差的一次差分和二次差分,Actor实现系统状态到PID参数的映射,Critic则对Actor的输出进行评判并且生成时序差分(temporaldifference,TD)误差信号.基于AC学习的体系结构和TD误差性能指标,给出了控制器设计的步骤流程图.两个仿真实验表明:与传统的PID控制器相比,基于AC学习的PID控制器在响应速度和自适应能力方面要优于传统PID控制器.  相似文献   

2.
基于模糊RBF神经网络的函数逼近   总被引:4,自引:1,他引:3  
提出了一种模糊RBF网络,将模糊逻辑的知识表达以及推理能力和RBF网络的快速学习和泛化能力结合起来,网络结构参数可按实际问题调整,仿真表明网络具有较快的学习速度和较高的函数逼近精度。  相似文献   

3.
张昭昭  乔俊飞  余文 《控制与决策》2017,32(7):1247-1252
针对LM算法不能在线训练RBF网络以及RBF网络结构设计算法中存在的问题,提出一种基于LM算法的在线自适应RBF网络结构优化算法.该算法引入滑动窗口和在线优化网络结构的思想,滑动窗口的引入既使得LM算法能够在线训练RBF网络,又使得网络对学习参数的变化具有更好的鲁棒性,并且易于收敛.在线优化网络结构使得网络在学习过程中能够根据训练样本的训练误差和隐节点的相关信息,在线自适应调整网络结构,跟踪非线性时变系统的变化,使网络维持最为紧凑的结构,以保证网络的泛化性能.最后通过仿真实验验证了所提出算法的性能.  相似文献   

4.
针对连续空间下的强化学习控制问题,提出了一种基于自组织模糊RBF网络的Q学习方法.网络的输入为状态,输出为连续动作及其Q值,从而实现了“连续状态—连续动作”的映射关系.首先将连续动作空间离散化为确定数目的离散动作,采用完全贪婪策略选取具有最大Q值的离散动作作为每条模糊规则的局部获胜动作.然后采用命令融合机制对获胜的离散动作按其效用值进行加权,得到实际作用于系统的连续动作.另外,为简化网络结构和提高学习速度,采用改进的RAN算法和梯度下降法分别对网络的结构和参数进行在线自适应调整.倒立摆平衡控制的仿真结果验证了所提Q学习方法的有效性.  相似文献   

5.
自适应RBF-LBF串联神经网络结构与参数优化方法   总被引:2,自引:0,他引:2  
高大启 《计算机学报》2003,26(5):575-586
研究了前向单层径基函数(RBF)网络和前向单层线性基本函数(LBF)网络的分类机理,提出了RBF的中心和宽度应通过学习自动确定,在学习过程中根据错分样本被错分入的类别自动生成新的核函数这一观点.如果两个或两个以上核函数属于同一类,在输入空间相距较近且未被其它类别的样本分隔开来的情况下,则应考虑将之合并,或者使它们的作用区域部分重叠.从理论上阐明了采用Sigmoid活化函数的单层感知器的分类阈值为0.5,进而提出了由单层RBF网络和单层感知器组成的串联RBF—LBF神经网络.文中详细给出了确定该串联RBF—LBF神经网络结构、核函数个数、位置与宽度的优化算法.一般来说,该算法的计算复杂性比前向单隐层感知器采用的误差反传算法要小或至少相当.对几个经典的模式分类难题的处理结果表明,与一般RBF网络和前向单隐层感知器网络相比,该串联RBF—LBF网络及其自适应学习算法具有收敛速度快,分类精度高,易于得到最小结构,在学习过程中不易陷入局部极小点等优点,有利于实现实时分析.实验结果同时也验证了单层LBF网络对提高RBF—LBF网络分类正确率的重要性.  相似文献   

6.
针对D2D混合蜂窝网络在进行信道分配时难以在较高信噪比条件下进行自动信道分配的问题,提出了一种基于替代迹的蜂窝网络信道分配Actor-Critic算法。首先,在定义了信道分配的约束条件下对信道分配问题进行数学建模,然后,建立信道分配问题的MDP模型,在MDP模型的基础上定义基于替代迹的Actor-Critic算法。Actor部分采用基于模拟退火的探索策略,通过温度变化自适应控制状态空间中探索的范围,将Critic部分求解的值函数的时间差分误差用于更新该策略的优先级,再依优先级对策略进行更新。Critic部分采用基于替代迹的值函数更新方式,并计算值函数的时间差分误差,以指导Actor改进策略。为了验证文中方法,对基于替代迹的蜂窝网络信道分配问题进行了仿真和验证,结果表明了文中方法具有系统吞吐量大和信噪比高的优点,是一种可行的混合蜂窝网络的信道分配方法。  相似文献   

7.
自适应模糊RBF神经网络的多智能体机器人强化学习   总被引:3,自引:0,他引:3  
多机器人环境中的学习,由于机器人所处的环境是连续状态,连续动作,而且包含多个机器人,因此学习空间巨大,直接应用Q学习算法难以获得满意的结果。文章研究中针对多智能体机器人系统的学习问题,提出自适应模糊RBF神经网络强化学习算法,网络本身具有模糊推理能力、较强的函数逼近能力以及泛化能力,因此,实现了人类专家知识与机器学习方法的结合,减少学习问题的复杂度;实现连续状态空间与动作空间的策略学习。  相似文献   

8.
优化的RBF网络在特征选择中的应用研究   总被引:2,自引:0,他引:2  
提出了一个自适应量子粒子群优化算法,用于训练RBF网络的基函数中心和宽度,并结合最小二乘法计算网络权值,对RBF网络的泛化能力进行改进并用于特征选择.实验结果表明,采用自适应量子粒子群优化算法获得的RBF网络模型不但具有很强的泛化能力,而且具有良好的稳定性,能够选择出较优秀的特征子集.  相似文献   

9.
一种基于RBF网络提取模糊规则的算法实现   总被引:6,自引:4,他引:2  
径向基函数网络和模糊推理系统在一些柔和的情况下具有等价的功能,因此可以利用神经网络的学习算法来调节模糊系统的参数,学习后的模糊系统具有自学习和自组织性,但是削弱了模糊系统的可解释性。将模糊逻辑推理与神经网络控制技术相结合,分析了一种改进的径向基函数(RBF)神经网络结构,这种模糊神经网络结构能够有效地表达模糊系统可解释性这一突出特点,也使模糊系统具有了较好的自学习和自组织能力、通过VC 实现了基于这种RBF网络结构提取模糊规则的算法,并进行了仿真实验,仿真结果表明该算法是比较有效的。  相似文献   

10.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。  相似文献   

11.
One of the difficulties encountered in the application of reinforcement learning methods to real-world problems is their limited ability to cope with large-scale or continuous spaces. In order to solve the curse of the dimensionality problem, resulting from making continuous state or action spaces discrete, a new fuzzy Actor-Critic reinforcement learning network (FACRLN) based on a fuzzy radial basis function (FRBF) neural network is proposed. The architecture of FACRLN is realized by a four-layer FRBF neural network that is used to approximate both the action value function of the Actor and the state value function of the Critic simultaneously. The Actor and the Critic networks share the input, rule and normalized layers of the FRBF network, which can reduce the demands for storage space from the learning system and avoid repeated computations for the outputs of the rule units. Moreover, the FRBF network is able to adjust its structure and parameters in an adaptive way with a novel self-organizing approach according to the complexity of the task and the progress in learning, which ensures an economic size of the network. Experimental studies concerning a cart-pole balancing control illustrate the performance and applicability of the proposed FACRLN.  相似文献   

12.
基于模糊RBF神经网络的非线性滤波   总被引:3,自引:1,他引:3  
该文从基本的智能技术——神经网络(NN)和模糊系统(FS)技术出发,探讨了神经网络与模糊系统相结合的基本理论,提出了一种基于模糊RBF神经网络的非线性滤波的方法。该方法将模糊逻辑的知识表达以及推理能力和RBF网络的快速学习和泛化能力结合起来,网络结构参数可按实际问题调整,对信号中有色噪声进行较高精度的逼近,来达到非线性滤波的目的。该滤波方法显示出很强的处理问题的能力,学习速度快,仿真结果表明了这种方法的有效性和可性行。  相似文献   

13.
一种基于模糊径向基函数神经网络的自学习控制器   总被引:3,自引:0,他引:3  
提出了一种新型的基于模糊径向基函数 (RBF)的神经网络学习控制器 ,并应用于电液伺服系统 .由于RBF网络和模糊推理系统具有函数等价性 ,采用模糊经验值方法选取网络中心值和基函数数目 .与一般的神经网络自学习控制器不同 ,以系统动态误差作为网络输入量 ,RBF神经网络控制器学习的是整个系统的动态逆过程 ,因而控制性能明显提高 .对电液位置伺服系统的仿真和实验结果表明 ,该控制方案可以有效提高系统的控制精度和自适应能力  相似文献   

14.
针对换热器的复杂非线性特征,利用一种模糊RBF神经网络结构,对其网络学习算法进行部分改进,并用于解决换热器的建模问题。采用模糊RBF神经网络不仅符合人的思维推理方式,也提高了神经网络的学习泛化能力,在改进的学习算法中通过学习率的值的不断变化和添加动量项,可以使学习速度加快,提高了辨识换热器模型的准确性。通过与传统的学习算法的仿真比较,验证了所提出的改进学习算法在辨识精度和稳定性方面具有更好的效果。  相似文献   

15.
The aim of this article is to introduce a new approach for fuzzy neural network models which can be used effectively in function approximation problems. The proposed model is introduced as an adaptive two-level fuzzy inference system. The architecture of the model is basically a two-layer network of new types of fuzzy-neurons which act as fuzzy IF–THEN rules. The model can be considered as a logical version of the Radial Basis Function networks (RBF). Genetic Algorithms have been adopted as the learning mechanism of the proposed model. Simulations show both highly nonlinear mapping and reasoning capabilities together with simpler structure and better performance when compared with classical neural networks.  相似文献   

16.
This paper presents a new evolutionary cooperative learning scheme, able to solve function approximation and classification problems with improved accuracy and generalization capabilities. The proposed method optimizes the construction of radial basis function (RBF) networks, based on a cooperative particle swarm optimization (CPSO) framework. It allows for using variable-width basis functions, which increase the flexibility of the produced models, while performing full network optimization by concurrently determining the rest of the RBF parameters, namely center locations, synaptic weights and network size. To avoid the excessive number of design variables, which hinders the optimization task, a compact representation scheme is introduced, using two distinct swarms. The first swarm applies the non-symmetric fuzzy means algorithm to calculate the network structure and RBF kernel center coordinates, while the second encodes the basis function widths by introducing a modified neighbor coverage heuristic. The two swarms work together in a cooperative way, by exchanging information towards discovering improved RBF network configurations, whereas a suitably tailored reset operation is incorporated to help avoid stagnation. The superiority of the proposed scheme is illustrated through implementation in a wide range of benchmark problems, and comparison with alternative approaches.  相似文献   

17.
径向基函数神经网络的一种两级学习方法   总被引:2,自引:1,他引:1  
建立RBF(radial basis function)神经网络模型关键在于确定网络隐中心向量、基宽度参数和隐节点数.为设计结构简单,且具有良好泛化性能径向基网络结构,本文提出了一种RBF网络的两级学习新设计方法.该方法在下级由正则化正交最小二乘法与D-最优试验设计结合算法自动构建结构节俭的RBF网络模型;在上级通过粒子群优化算法优选结合算法中影响网络泛化性能的3个学习参数,即基宽度参数、正则化系数和D-最优代价系数的最佳参数组合.仿真实例表明了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号