共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
3.
Agent组织规则的再励学习 总被引:2,自引:0,他引:2
Agent组织是一种灵活有效的多Agent系统求解方式。Agent组织规则在Agent组织的求解过程中起着重要作用,可以有效地减少冲突提高求解效率。给出了一种基于再励学习的Agent组织规则生成机制和相应的算法,通过实验表明了算法的有效性,改进了Zambonelli和Jennings等人关于Agent组织规则的工作。 相似文献
4.
提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案,解决了多控制目标下列车控制问题,确保了列车准确运行。仿真取得了令人满意的结果。结果表明,这种将模糊控制和再励学习相结合的智能控制方法综合用于列车运行控制是可行的,可以较好地保证舒适性、停车准确性和正点性。 相似文献
5.
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性. 相似文献
6.
7.
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。 相似文献
8.
9.
10.
本文介绍了Agent组织规则及再励学习的理论,给出了一种基于再励学习的Agem组织规则生成机制和相应的算法。从而得出结论:Agent组织规则在求解过程中起着重要的作用,可以有效地减少冲突,提高求解效率。 相似文献
11.
12.
随着道路交通流量日益增加,现有交通灯使用的时间固定控制方法并不能很好地满足各种复杂交通情况。针对这一背景,在使用视频图像对车辆跟踪计数实时采集车流量的基础上,提出一种根据各方向车流量控制交通灯时间的算法。该算法根据实时的车流情况更新各方向的绿灯分配时间,自动调节各方向绿灯时间比例,并根据路口总车流量的大小智能调节绿灯时间周期大小。基于Delphi平台对算法进行仿真,结果表明:该算法能根据实时车流信息自适应调整各方向绿灯时长,并通过自动调节各方向绿灯时间总和来有效实现交通拥堵或畅通情况下交通灯的智能控制。 相似文献
13.
基于神经网络的强化学习算法研究 总被引:11,自引:0,他引:11
BP神经网络在非线性控制系统中被广泛运用,但作为有导师监督的学习算法,要求批量提供输入输出对神经网络训练,而在一些并不知道最优策略的系统中,这样的输入输出对事先并无法得到,另一方面,强化学习从实际系统学习经验来调整策略,并且是一个逼近最优策略的过程,学习过程并不需要导师的监督。提出了将强化学习与BP神经网络结合的学习算法-RBP模型。该模型的基本思想是通过强化学习控制策略,经过一定周期的学习后再用学到的知识训练神经网络,以使网络逐步收敛到最优状态。最后通过实验验证了该方法的有效性及收敛性。 相似文献
14.
一种基于强化学习的学习Agent 总被引:22,自引:2,他引:22
强化学习通过感知环境状态和从环境中获得不确定奖赏值来学习动态系统的最优行为策略,是构造智能Agent的核心技术之一,在面向Agent的开发环境AODE中扩充BDI模型,引入策略和能力心智成分,采用强化学习技术实现策略构造函数,从而提出一种基于强化学习技术的学习Agent,研究AODE中自适应Agent物结构和运行方式,使智能Agent具有动态环境的在线学习能力,有效期能够有效地满足Agent各种心智要求。 相似文献
15.
基于改进的遗传算法和模糊逻辑控制的移动机器人导航 总被引:15,自引:1,他引:15
本文给出了一种用遗传算法学习模糊规则以完成移动机器人导航的方法.采用了变长度编码
方法和竞争型小生境遗传算法,减少了染色体的尺寸和复杂度,同时提高了学习速度.本文
考虑了轮式移动机器人的运动模型,将更符合实际情况的左右轮速度作为模糊规则的输出.
整个学习过程在仿真环境下完成后,在仿真和自行开发的全局视觉平台上对学到的规则进行
了验证,实验结果证明了方法的正确性. 相似文献
16.
17.
基于遗传算法的概念学习中的约束满足预处理方法 总被引:1,自引:0,他引:1
本文将概念学习视为约束满足问题,给出了两种约束的定义,在这些约束的基础上,实现了基于遗传算法的概念学习系统CLS的预处理方法。 相似文献
18.
基于Petri网技术的交通信号相位调节研究 总被引:2,自引:0,他引:2
提出了一种将Petri网技术应用干交通信号控制系统之中的策略。应用Petri网对典型的交叉路口进行建模分析,通过设定相位次序来提高交通效率。该模型能够有效地描述交通过程中的动态行为,利于分析和验证,并且易于实现。 相似文献
19.
针对反向选择算法在面对大量的网络通信数据或具有多个分离特征区间网络通信数据时的无效性,提出了基于模糊控制及遗传算法的人工免疫入侵检测算法,利用模糊控制原理对抗体进行浓缩,并通过遗传算法进化种群,从而使得抗体的数量得到控制且检测效率较高. 相似文献