首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
模糊Q学习的足球机器人双层协作模型   总被引:1,自引:0,他引:1  
针对传统的足球机器人3层决策模型存在决策不连贯的问题和缺乏适应性与学习能力的缺点,提出了一种基于模糊Q学习的足球机器人双层协作模型.该模型使协调决策和机器人运动成为2个功能独立的层次,使群体意图到个体行为的过度变为一个直接的过程,并在协调层通过采用Q学习算法在线学习不同状态下的最优策略,增强了决策系统的适应性和学习能力.在Q学习中通过把状态繁多的系统状态映射为为数不多的模糊状态,大大减少了状态空间的大小,避免了传统Q学习在状态空间和动作空间较大的情况下收敛速度慢,甚至不能收敛的缺点,提高了Q学习算法的收敛速度.最后,通过在足球机器人SimuroSot仿真比赛平台上进行实验,验证了双层协作模型的有效性.  相似文献   

2.
为提高遗传算法的收敛性能,借鉴生态学对个体生存环境和种群竞争的认识,并根据原有的生态种群竞争模型的协同进化模式,对种群增长与环境间的动力学特征的方程进行了优化,提出了一种变增长率的多种群竞争协同进化.利用信息熵的概念,构造出含有熵的多目标优化模型,利用该模型可以直接显式地给出作为拉格朗日乘子的种群最优解存在概率,从而得出种群的增长率.采用该模式的遗传算法在改善未成熟收敛和收敛速度两方面具有较好的性能.  相似文献   

3.
一种量子神经网络模型学习算法及应用   总被引:4,自引:0,他引:4  
提出一种量子神经网络模型及学习算法. 首先基于生物神经元信息处理机制和量子计算原理构造出一种量子神经元, 该神经元由加权、聚合、活化、激励四部分组成. 然后由量子神经元构造出三层量子神经网络模型, 其输入和输出为实值向量, 权值和活性值为量子比特. 基于梯度下降法构造了该模型的超线性收敛学习算法. 通过模式识别和函数逼近两种仿真结果表明该模型及算法是有效的.  相似文献   

4.
层次泛函网络整体学习算法   总被引:12,自引:1,他引:11  
周永权  焦李成 《计算机学报》2005,28(8):1277-1286
文中设计了一类单输人单输出泛函网络与双输人单输出泛函网络作为构造层次泛函网络基本模型,提出了一种层次泛函网络模型,给出了层次泛函网络构造方法和整体学习算法,而层次泛函网络的参数利用解方程组来进行逐层学习.以非线性代数方程组为例,指出人们熟知的一些数学解题方法可以用层次泛函网络来表达,探讨了基于层次泛函网络求解非线性代数方程组学习算法实现的一些技术问题.相对传统方法,层次泛函网络更适合于具有层次结构的应用领域.计算机仿真结果表明,这种层次学习方法具有较快的收敛速度和良好的逼近性能.  相似文献   

5.
基于偏向信息学习的双层强化学习算法   总被引:1,自引:0,他引:1  
传统的强化学习存在收敛速度慢等问题,结合先验知识预置某些偏向可以加快学习速度.但是当先验知识不正确时又可能导致学习过程不收敛.对此,提出基于偏向信息学习的双层强化学习模型.该模型将强化学习过程和偏向信息学习过程结合起来:偏向信息指导强化学习的行为选择策略,同时强化学习指导偏向信息学习过程.该方法在有效利用先验知识的同时能够消除不正确先验知识的影响.针对迷宫问题的实验表明,该方法能够稳定收敛到最优策略;并且能够有效利用先验知识提高学习效率,加快学习过程的收敛.  相似文献   

6.
杨博  苏小红  王亚东 《软件学报》2005,16(6):1073-1080
为了解决传统BP(back-propagation)算法收敛速度慢,训练得到的网络性能较差的问题,在借鉴生理学中"选择性注意力模型"的基础上,将遗传算法与误差放大的BP学习算法进行了有机的融合,提出了基于注意力模型的快速混合学习算法.该算法的核心在于将单独的BP训练过程划分为许多小的切片,并对每个切片进行误差放大的训练和竞争淘汰机制的选择.通过发现收敛速率较快的个体和过滤陷入局部极值的个体,来保证网络训练的成功率和实现快速向全局最优区域逼近的目的.仿真结果表明,该算法有效地解决了传统BP算法中由于初始权值的随机性造成的训练失败问题,并能有效解决饱和区域引起的后期训练缓慢问题,在不增加网络隐层节点数的情况下,显著地提高了网络的收敛精度和泛化能力.这将使神经网络在众多实际的分类问题上具有更广泛的应用前景.  相似文献   

7.
基于AER模型的Multi-Agent遗传算法   总被引:1,自引:0,他引:1  
本文在分析标准遗传算法的优点和不足的基础上,基于AER模型提出了一种新的遗传算法--Multi-Agent遗传算法.它利用Agent的局部感知、竞争协同和自学习等特性来实现生物对环境的自适应,从而实现全局优化计算.理论分析证明这种算法是以概率1收敛的.在实验中,我们首先用10个维数为30的标准测试函数来全面测试算法的性能,然后用50~200维的Rastrigin函数来测试算法处理高维函数的能力.结果表明本文算法具有较强的全局优化能力,鲁棒性强,且具有良好的处理高维函数的能力.  相似文献   

8.
贾俊芳 《计算机应用》2011,31(8):2134-2137
针对传统主动学习(AL)方法对大规模的无标记样本分类收敛速度过慢的问题,提出了基于层次聚类(HC)的主动学习训练算法--HC_AL方法。通过对大规模的未标记数据进行层次聚类,并对每个层次上的类中心打标记来代替该层次上的类标记,然后将该层次上具有错误标记的类中心加入训练集。在数据集上的实验取得了较好的泛化能力和较快的收敛速度。实验结果表明通过采用分层细化、逐步求精的方法,可使主动学习的收敛速度大大提高,同时获得较为满意的学习能力。  相似文献   

9.
模糊学习矢量量化算法 (FL VQ)虽然解决了硬的竞争学习对初始码本的依赖性问题 ,但收敛速度变慢 ,且仍无法克服陷入局部最小 .为此在分析模糊学习矢量量化图象编码原理的基础上 ,探讨了 FL VQ算法的几种优化途径 ,进而提出了一种基于 Tabu搜索 (TS)的模糊学习矢量量化的新算法 (TS- FL VQ) ,并给出了该算法的具体实现方法及步骤 .该算法首先利用 TS技术产生一个面向全局搜索的寻优列表 ,然后再进行模糊学习以得到最优解 .实验结果表明 ,该算法在收敛速度及编码效果上均较 FL VQ有较大的提高 .  相似文献   

10.
在联邦学习背景下,由于行业竞争、隐私保护等壁垒,用户数据保留在本地,无法集中在一处训练.为充分利用用户的数据和算力,用户可通过中央服务器协同训练模型,训练得到的公共模型为用户共享,但公共模型对于不同用户会产生相同输出,难以适应用户数据是异质的常见情形.针对该问题,提出一种基于元学习方法 Reptile的新算法,为用户学习个性化联邦学习模型. Reptile可高效学习多任务的模型初始化参数,在新任务到来时,仅需几步梯度下降就能收敛到良好的模型参数.利用这一优势,将Reptile与联邦平均(federated averaging, FedAvg)相结合,用户终端利用Reptile处理多任务并更新参数,之后中央服务器将用户更新的参数进行平均聚合,迭代学习更好的模型初始化参数,最后将其应用于各用户数据后仅需几步梯度下降即可获得个性化模型.实验中使用模拟数据和真实数据设置了联邦学习场景,实验表明该算法相比其他算法能够更快收敛,具有更好的个性化学习能力.  相似文献   

11.
Learning Sequential Decision Rules Using Simulation Models and Competition   总被引:12,自引:7,他引:5  
The problem of learning decision rules for sequential tasks is addressed, focusing on the problem of learning tactical decision rules from a simple flight simulator. The learning method relies on the notion of competition and employs genetic algorithms to search the space of decision policies. Several experiments are presented that address issues arising from differences between the simulation model on which learning occurs and the target environment on which the decision rules are ultimately tested.  相似文献   

12.
一种新型的基于遗传算法的进化模糊推理系统   总被引:2,自引:0,他引:2  
卓茗  孙增圻 《计算机工程》2006,32(3):180-182
介绍了遗传算法和进化模糊推理系统的融合方式及结构,应用一种新型的基于遗传算法的进化模糊推理系统动态自适应的在线学习和离线学习。使用进化聚类方法,模糊规则在系统执行过程中进行创建和更新,并且采用遗传算法优化进化聚类的结果,修改成员的隶属度函数,通过模糊推理系统计算系统的输出。  相似文献   

13.
针对非线性液位控制问题,提出了一种采用遗传小脑模型神经网络(CMAC)的学习控制方法;该控制器采用遗传算法作为CMAC神经网络的学习算法,给出了具体的控制结构和算法;仿真结果表明,该控制器具有良好的处理非线性以及跟踪连续变化信号的能力,并对时变外负载干扰具有明显的抑制作用,而且新型控制器能使用较高的学习速率,学习速度快,适于在线学习控制。  相似文献   

14.
This study is concerned with a general methodology of identification of fuzzy models. Unlike numeric models, fuzzy models operate at a level of information granules - fuzzy sets - and this aspect brings up an important design requirement of transparency of the model. We propose a three-phase development framework by distinguishing between structural and parametric optimization processes. The underlying topology of the model dwells on fuzzy neural networks - architectures governed by fuzzy logic and equipped with parametric flexibility. Two general optimization mechanisms are explored: the structural optimization is realized via genetic programming whereas for the ensuing detailed parametric optimization we proceed with gradient-based learning. The main advantages of this approach are discussed in detail. The study is illustrated with the aid of a numeric example that provides a detailed insight into the performance of the fuzzy models and quantifies crucial design issues.  相似文献   

15.
提出一种基于遗传算法的进化计算模型(ECM).在ECM的种群中,每个成员都根据其适应度值不同程度地影响着种群的进化.ECM定义了个体对进化的影响因子,并以个体的影响因子为参数定义了个体的形成算子.分析表明,ECM是采用算术交叉算子的两父辈遗传算法以及采用频率扫描交叉算子的多父辈交叉遗传算法的推广,形成操作是父代群体编码的凸组合.实验研究显示,ECM具有比经典遗传算法更强的优化计算功能.  相似文献   

16.
The Expectation Confirmation Model (ECM) is a popular model used to explain the continuance of information system usage. However, past studies have found that the ECM, based on extrinsic motivations (e.g. perceived usefulness, user satisfaction), has limitations insofar as people often have both intrinsic and extrinsic motivations simultaneously. This study used the belief of causal attributions to extend the ECM and verify it in a web-based learning system (WLS) context. Nine hypotheses were derived from the modified ECM. Empirical data were collected by a mail survey from faculty with experience of WLS in Taiwanese universities. The final sample used for further analysis comprised of 144 respondents. The results revealed that the modified ECM has greater power to explain the continued intention of WLS usage even if the effects of user satisfaction and perceived usefulness on continued intention are reduced.  相似文献   

17.
将智能体模型与知识模型相结合,提出一种知识引导的多目标多智能体进化算法.算法定义了智能体的不同邻域环境,并通过对邻域之间的竞争、正交交叉、知识学习等操作实现种群的演化过程.算法采用一种新颖的方法求非劣解集,并使用循环拥挤排序法对外部归档集进行维护.通过对多个测试函数的仿真结果表明,知识的引入不仅增加了种群多样性,而且提高了算法的收敛性.  相似文献   

18.
殷凡  张建明 《计算机工程与设计》2005,26(10):2802-2804,2827
针对当前的协作学习系统很少考虑到学习者知识水平、认知特性、兴趣等个性化属性,提出了一个基于学习者知识水平的分层多Agent学习系统模型,该模型结合智能代理技术,通过对学习者知识水平的界定实现系统的分层结构,较好地解决了现有学习系统中普遍存在而又尚未解决的无序和混乱、群体互动效果、个性化以及系统通讯开销等问题。  相似文献   

19.
针对最佳熵阈值图像分割算法过程中计算复杂度高的问题,提出了一种基于链式竞争遗传算法的最佳熵阈值确定法(KSW熵法)的图像分割算法.通过将3个邻域的链式竞争引入到常规遗传算法框架下,实现特征选择过程;将改进的遗传算法应用到最佳阈值图像分割算法中,完成对阈值的寻优过程.仿真实验结果与分析表明:算法在分割速度和效果上均优于传统的最佳阈值图像分割算法和单纯的遗传优化最佳阈值图像分割算法.  相似文献   

20.
高维流式大数据的产生与发展对传统机器学习和数据挖掘算法提出了诸多挑战。本文结合流式大数据流式到达的特性,首先建立自适应增量特征提取算法模型。然后,针对噪声环境,建立基于特征空间校准的增量流形学习算法模型,解决小样本问题。最后,构造流形学习的正则化优化框架,解决高维数据流特征提取过程中产生的降维误差问题,并得到最终的最优解。实验结果表明本文提出的算法框架符合流形学习算法的3个 评价指标:稳定性、提高性以及学习曲线能迅速增加到一个相对稳定的水平;从而实现了高维数据流的高效学习。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号