共查询到19条相似文献,搜索用时 171 毫秒
1.
2.
基于强化学习的多Agent协作研究 总被引:2,自引:0,他引:2
强化学习为多Agent之间的协作提供了鲁棒的学习方法.本文首先介绍了强化学习的原理和组成要素,其次描述了多Agent马尔可夫决策过程MMDP,并给出了Agent强化学习模型.在此基础上,对多Agent协作过程中存在的两种强化学习方式:IL(独立学习)和JAL(联合动作学习)进行了比较.最后分析了在有多个最优策略存在的情况下,协作多Agent系统常用的几种协调机制. 相似文献
3.
具有时滞的不确定性系统神经网络模型自学习控制 总被引:2,自引:1,他引:1
本文对具有时滞的不确定性控制对象提出了一种神经网络时滞补偿模糊自学习控制方法,模糊控制器采用误差、误差变化及误差加速度的加权和的解析描述形式,利用人工神经网络直接对过程建模,实现对时滞补偿预报以及对模糊加权因子的自学习优化调整,将上述方法用于焊接熔池动态过程控制试验,结果表明本文提出的自学习神经网络时滞补偿模糊控制方案有效。 相似文献
4.
研究人工神经网络的信息处理机制是模拟人脑功能要解决的一个重要问题,在信息几何框架下,该机制可以通过研究信息系统的几何结构来讨论.本文提出了一种简化的模拟人类思维层次的层次化神经系统模型,并利用基于信息几何的神经场学习理论解释了不同层次的神经系统通过前馈和反馈连接进行动态交互作用的逼近学习机制,进而从整体宏观的角度对人脑学习机理以及概念形成给出了一个数学上的描述. 相似文献
5.
6.
7.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。 相似文献
8.
本文提出一种规则结论部分的语言变量具有离散隶属度函数的、基于Mamdani形规则的新神经模糊系统,并描述了它的学习算法.新神经模糊系统由模糊推理系统及其一一对应的神经网络系统构成.在只有训练数据的情况下,首先提出了一种基于RBF神经网络的模糊建模方法.而在模糊推理系统由模糊建模或者直接由专家经验知识确定后,应用梯度下降法优化神经网络系统参数.倒立摆控制和时间序列预测的仿真试验体现了本文提出的新的神经模糊系统的可用性和优越性. 相似文献
9.
10.
分析了目前主体服务匹配中存在的问题和不足,针对多主体系统中模糊匹配的需求,提出了一种主体模糊服务描述方法.在模糊服务描述的基础上提出了4种模糊匹配算法:基于语法的近似模糊匹配算法、基于语义的近似模糊匹配算法、等价模糊匹配算法和插入模糊匹配算法,并给出了它们的实现方法.这些算法克服了目前主体服务匹配算法中存在的不足. 相似文献
11.
一种解释学习系统的模型EBL/GA 总被引:3,自引:0,他引:3
解释学习是演绎式学习方法,而遗传算法是归纳式学习方法。本文提出的解释学习系统模型EBL/GA,结合两者的优点提高了系统的效用。 相似文献
12.
13.
基于解释学习的可操作性 总被引:1,自引:1,他引:1
可操作性是基于解释机器学习的关键问题,本文给出了一种以模糊集理论来描述可操作性的方法,建立了EBL的模型,这一结果优于Keller等人的工作。 相似文献
14.
强化学习系统及其基于可靠度最优的学习算法 总被引:3,自引:0,他引:3
归纳了强化学习的主要理论方法,提出了一个区分主客观因素的强化学习系统描述,引入了任务域的概念,针对以往强化学习采用的期望最优准则描述任务域能力的不足,考虑了目标水平准则下的首达时间可靠度优准则模型,分别结合随机逼近理论和时间差分理论,提出了基于概率估计的J-学习和无需建增量R-学习。 相似文献
15.
In this paper, a new approach to designing fuzzy‐learning fuzzy controllers for a system plant without an exact mathematical model is presented. The cost function is defined as the square of the sliding function to alleviate the difficulty of overshoot when on‐line learning is conducted. The learning mechanism of a fuzzy controller is constructed so as to minimize the cost function with a set of linguistic rules. Moreover, to reduce the complexity of the fuzzy‐learning fuzzy controller, the fuzzy mechanism used for learning and the fuzzy mechanism contained in the fuzzy controller are designed so as to have the identical structures. Finally, simulations are included to show the effectiveness of the fuzzy‐learning fuzzy controllers. 相似文献
16.
17.
18.
竞争式Takagi-Sugeno模糊再励学习 总被引:4,自引:0,他引:4
针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络(CTSFRLN),该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法.文中相应提出了两种学习算法,即竞争式Takagi-Sugeno模糊Q-学习算法和竞争式Takagi-Sugeno模糊优胜学习算法,其把CTSFRLN训练成为一种所谓的Takagi-Sugeno模糊变结构控制器.以二级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法. 相似文献