共查询到20条相似文献,搜索用时 109 毫秒
1.
基于再励学习与遗传算法的交通信号自组织控制 总被引:16,自引:1,他引:16
提出一种基于再励学习和遗传算法的交通信号自组织控制方法.再励学习针对每一个道路交叉口交通流的优化,修正每个信号灯周期的绿信比.遗传算法则产生局部学习过程的全局优化标准,修正信号灯周期的大小.这种方法将局部优化和全局优化统一起来,克服了现有的控制方法需要大量数据传输通讯、准确的交通模型等缺陷. 相似文献
2.
3.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例.仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。 相似文献
4.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。 相似文献
5.
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性. 相似文献
6.
7.
提出一种新的智能优化调度方法,将再励学习控制运用到电梯群控系统中,采用基于交通模式识别的小脑模型神经网络作为控制器,以乘客平均候梯时间最短为控制目标设计出电梯群控系统的控制方案.该控制方法不需要过多的专家知识及学习样本,可以实现在线学习并具有较强的自适应能力,提高了系统的效率并且使系统性能得到优化.以层间交通模式为例对系统进行仿真,结果证明了该方法的可行性及有效性. 相似文献
8.
9.
10.
本文介绍了Agent组织规则及再励学习的理论,给出了一种基于再励学习的Agem组织规则生成机制和相应的算法。从而得出结论:Agent组织规则在求解过程中起着重要的作用,可以有效地减少冲突,提高求解效率。 相似文献
11.
12.
Genetic Reinforcement Learning for Neurocontrol Problems 总被引:4,自引:1,他引:4
Whitley Darrell Dominic Stephen Das Rajarshi Anderson Charles W. 《Machine Learning》1993,13(2-3):259-284
Empirical tests indicate that at least one class of genetic algorithms yields good performance for neural network weight optimization in terms of learning rates and scalability. The successful application of these genetic algorithms to supervised learning problems sets the stage for the use of genetic algorithms in reinforcement learning problems. On a simulated inverted-pendulum control problem, genetic reinforcement learning produces competitive results with AHC, another well-known reinforcement learning paradigm for neural networks that employs the temporal difference method. These algorithms are compared in terms of learning rates, performance-based generalization, and control behavior over time. 相似文献
13.
14.
基于遗传算法求解TSP问题的一种新方法 总被引:3,自引:0,他引:3
针对基于遗传算法求解TSP的效率问题,提出了一种基于位操作编码技术,并给出了基于位操作的交配、变异等基本操作的实现方法,有效地提高了计算过程中的空间利用率和计算效率。 相似文献
15.
提出一种用于汽车排放试验中驾驶机器人对车速跟踪控制的新方法.该控制方法基于神经网络并结合强化学习的自适应能力,通过神经网络的在线学习对车速进行跟踪控制.利用试验汽车所获得的数据,首先开发出用于车速控制的神经网络模型.然后基于强化学习神经网络结构设计神经网络控制器以取得车速跟踪的自适应控制.在仿真研究中,使用神经网络车速控制模型替代实际汽车来训练初始控制器,并用开发与训练好的自学习神经网络控制器用于汽车车速跟踪控制.结果表明,所开发的神经网络控制器具有良好的车速跟踪性能,控制效果明显. 相似文献
16.
17.
胎儿体重是判断胎儿发育、保障孕产妇安全的重要指标,但是胎儿体重无法直接测得,只能根据孕妇体检数据进行预测.提出了一种基于遗传算法优化BP神经网络(GA-BPNN)的胎儿体重预测模型,首先采用回归模型和特征归一化预处理得到的历史体检数据建立孕妇连续体重变化模型,然后利用遗传算法(Genetic Algorithm,GA)优化BP神经网络的初始权值和阈值,建立胎儿体重预测模型.从我国东部某医院2016年孕产妇中随机抽取3000例样本数据,将本文的模型与基于传统BP神经网络(BPNN)的预测模型进行比较,实验结果表明,本文提出的GA-BPNN胎儿体重预测模型不仅加快了模型的收敛速度,而且将胎儿体重预测精度提高了14%. 相似文献
18.
19.
针对BP神经网络存在易陷入局部极小值、收敛速度慢等问题,提出用遗传算法优化BP神经网络并用于房价预测。采用BP神经网络建立房价预测模型。利用遗传算法对BP神经网络的初始权值和阈值进行优化。选取1998年2011年贵阳市的房价及其主要影响因素作为实验数据,分别对传统的BP神经网络和经过遗传算法优化后的BP神经网络进行训练和仿真实验,结果表明,与传统的BP神经网络预测模型相比,经过遗传算法优化后的BP神经网络预测模型能加快网络的收敛速度,提高房价的预测精度。 相似文献
20.
为解决传统遗传算法早熟收敛和收敛速度慢的问题,提出一种基于强化学习的多策略选择遗传算法MPSGA。通过使用不同的选择策略将整个种群划分为3个子种群并分别进化,能提高种群的多样性,有效避免遗传算法的早熟收敛问题。将种群的多样性和算法的运行机制相结合,根据种群多样性的变化运用强化学习算法动态地优化各子种群间的比例参数,从而将种群多样性保持在合适的范围,一定程度上解决了收敛速度和全局收敛性之间的矛盾。实验结果表明,该算法在收敛精度和搜索效率上都表现出较好的性能。 相似文献