期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张华军赵金《计算机工程》2010,36(1):18-20,2

提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关系,用预测网络逼近最优解的能力引导遗传算法在局部向最优解快速逼近,以解决遗传算法局部振荡问题,从而实现快速学习的能力。将其应用于矢量控制交流电机的速度环控制器自学习中,仿真实验验证了该算法的有效性。相似文献

2.

非线性系统的再励学习控制研究

蒋志明王丽红段锁林林廷圻《控制理论与应用》2000,17(6):899-902

研究了一种带有的CMAC神经网络的再励学习（RL）控制方法,以解决具有高度非线性的系统控制问题。研究的重点在于算法的简化以及具有连续输出的函数学习上。控制策略由两部分构成;再励学习控制器和固定增益常规控制器。前者用于学习系统的非线性,后者用于稳定系统。仿真结果表明,所提出的控制策略不仅是有效的,而且具有很高的控制精度。相似文献

3.

Agent组织规则的再励学习 总被引：2，自引：0，他引：2

张伟王一川石纯一《计算机研究与发展》2003,40(3):430-434

Agent组织是一种灵活有效的多Agent系统求解方式。Agent组织规则在Agent组织的求解过程中起着重要作用，可以有效地减少冲突提高求解效率。给出了一种基于再励学习的Agent组织规则生成机制和相应的算法，通过实验表明了算法的有效性，改进了Zambonelli和Jennings等人关于Agent组织规则的工作。相似文献

4.

基于再励学习的地铁列车运行过程的模糊自适应控制

滕振宇武妍《计算机工程》2003,29(20):63-65

提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案，解决了多控制目标下列车控制问题，确保了列车准确运行。仿真取得了令人满意的结果。结果表明，这种将模糊控制和再励学习相结合的智能控制方法综合用于列车运行控制是可行的，可以较好地保证舒适性、停车准确性和正点性。相似文献

5.

基于再励学习的主动队列管理算法 总被引：6，自引：0，他引：6

下载免费PDF全文

张雁冰杭大明马正新曹志刚《软件学报》2004,15(7):1090-1098

从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(reinforcement learning gradient-descent).RLGD以速率匹配和队列稳定为优化目标,根据网络状态自适应地调节更新步长,使得队列长度能够很快收敛到目标值,并且抖动很小.此外,RLGD不需要知道源端的速率调整算法,因而具有很好的可扩展性.通过不同网络环境下的仿真显示,RLGD与REM,PI等AQM算法相比,具有更好的性能和鲁棒性. 相似文献

6.

基于再励自组织模糊CPN的稳定控制系统设计

马勇许晓鸣杨煜普张卫东《控制与决策》1999,(Z1)

针对一类非线性系统,提出一种基于再励学习的自组织模糊ＣＰＮ的稳定控制系统。控制结构中采用滑模控制使状态到达设计的切换面,保证系统稳定;用基于再励学习的自组织模糊ＣＰＮ作为补偿控制器减弱系统不确定部分的影响。仿真实例表明了所给算法的有效性。相似文献

7.

基于Takagi-Sugeno的再励学习模糊神经网络控制

马力佳高岩《微计算机信息》2006,22(16):7-9

提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络,该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法。相应地,提出了一种优化学习算法,其把竞争式Takagi-Sugeno模糊再励学习网络训练成为一种所谓的Takagi-Sugeno模糊变结构控制器。以一级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法。相似文献

8.

再励学习——原理,算法及其在智能控制中的应用 总被引：20，自引：0，他引：20

阎平凡《信息与控制》1996,25(1):28-34

综述了再励学习的原理，主要算法，基于神经网络的实现及其在智能控制中的作用，探讨了应进一步研究的问题。相似文献

9.

基于模糊逻辑的路口交通信号控制 总被引：2，自引：0，他引：2

赵晨胡福乔施鹏飞《计算机工程》2003,29(10):50-52

城市交通控制(UTC)是智能交通系统中非常重要的组成部分。在一些复杂的交通情况下,使用传统的控制方法进行交通信号控制的效果并不好。由于模糊逻辑能够较好地描述复杂系统的定性模型,因此它非常适合对路口交通信号灯进行控制。该文给出了一种采用模糊逻辑进行路口信号灯控制的方法。通过从路口检测器获取车辆信息,模糊规则对信号灯进行优化控制。通过仿真模拟,给出了实验结果。相似文献

10.

基于Agent系统再励学习的应用

郭颂李朝纯杨开英《计算机应用与软件》2005,22(4):67-69

本文介绍了Agent组织规则及再励学习的理论,给出了一种基于再励学习的Agem组织规则生成机制和相应的算法。从而得出结论：Agent组织规则在求解过程中起着重要的作用,可以有效地减少冲突,提高求解效率。相似文献

11.

强化学习算法应用于船舶运动的混合智能控制 总被引：1，自引：0，他引：1

杨国勋郭晨贾欣乐《信息与控制》2002,31(2):127-131

将强化学习算法与混合智能技术相结合，应用于船舶运动控制，克服了通常混合智能算法的学习需要一定数量样本数据的缺陷，又能发挥各种智能算法的优势．仿真结果表明在缺少样本数据情况下，该算法可以在一定程度上改进控制效果．相似文献

12.

基于车流量的交通灯智能控制算法

王鼎湘李茂军《计算机应用与软件》2015,(6)

随着道路交通流量日益增加,现有交通灯使用的时间固定控制方法并不能很好地满足各种复杂交通情况。针对这一背景,在使用视频图像对车辆跟踪计数实时采集车流量的基础上,提出一种根据各方向车流量控制交通灯时间的算法。该算法根据实时的车流情况更新各方向的绿灯分配时间,自动调节各方向绿灯时间比例,并根据路口总车流量的大小智能调节绿灯时间周期大小。基于Delphi平台对算法进行仿真,结果表明:该算法能根据实时车流信息自适应调整各方向绿灯时长,并通过自动调节各方向绿灯时间总和来有效实现交通拥堵或畅通情况下交通灯的智能控制。相似文献

13.

基于神经网络的强化学习算法研究 总被引：11，自引：0，他引：11

陆鑫高阳李宁陈世福《计算机研究与发展》2002,39(8):981-985

BP神经网络在非线性控制系统中被广泛运用，但作为有导师监督的学习算法，要求批量提供输入输出对神经网络训练，而在一些并不知道最优策略的系统中，这样的输入输出对事先并无法得到，另一方面，强化学习从实际系统学习经验来调整策略，并且是一个逼近最优策略的过程，学习过程并不需要导师的监督。提出了将强化学习与BP神经网络结合的学习算法-RBP模型。该模型的基本思想是通过强化学习控制策略，经过一定周期的学习后再用学到的知识训练神经网络，以使网络逐步收敛到最优状态。最后通过实验验证了该方法的有效性及收敛性。相似文献

14.

一种基于强化学习的学习Agent 总被引：22，自引：2，他引：22

李宁高阳陆鑫陈世福《计算机研究与发展》2001,38(9):1051-1056

强化学习通过感知环境状态和从环境中获得不确定奖赏值来学习动态系统的最优行为策略,是构造智能Agent的核心技术之一,在面向Agent的开发环境AODE中扩充BDI模型,引入策略和能力心智成分,采用强化学习技术实现策略构造函数,从而提出一种基于强化学习技术的学习Agent,研究AODE中自适应Agent物结构和运行方式,使智能Agent具有动态环境的在线学习能力,有效期能够有效地满足Agent各种心智要求。相似文献

15.

基于改进的遗传算法和模糊逻辑控制的移动机器人导航 总被引：15，自引：1，他引：15

张文志吕恬生《机器人》2003,25(1):1-6

本文给出了一种用遗传算法学习模糊规则以完成移动机器人导航的方法.采用了变长度编码方法和竞争型小生境遗传算法，减少了染色体的尺寸和复杂度，同时提高了学习速度．本文考虑了轮式移动机器人的运动模型，将更符合实际情况的左右轮速度作为模糊规则的输出．整个学习过程在仿真环境下完成后，在仿真和自行开发的全局视觉平台上对学到的规则进行了验证，实验结果证明了方法的正确性．相似文献

16.

一种新的多智能体强化学习算法及其在多机器人协作任务中的应用 总被引：1，自引：0，他引：1

顾国昌仲宇张汝波《机器人》2003,25(4):344-348

在多机器人系统中，评价一个机器人行为的好坏常常依赖于其它机器人的行为，此时必须采用组合动作以实现多机器人的协作，但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢．本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数，并应用于多机器人协作任务之中．实验结果表明，基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略．相似文献

17.

基于遗传算法的概念学习中的约束满足预处理方法 总被引：1，自引：0，他引：1

陈恩红蔡庆生《计算机研究与发展》1997,34(7):497-501

本文将概念学习视为约束满足问题，给出了两种约束的定义，在这些约束的基础上，实现了基于遗传算法的概念学习系统ＣＬＳ的预处理方法。相似文献

18.

基于Petri网技术的交通信号相位调节研究 总被引：2，自引：0，他引：2

王若峥曹立明王小平《计算机应用与软件》2006,23(4):71-72,97

提出了一种将Petri网技术应用干交通信号控制系统之中的策略。应用Petri网对典型的交叉路口进行建模分析,通过设定相位次序来提高交通效率。该模型能够有效地描述交通过程中的动态行为,利于分析和验证,并且易于实现。相似文献

19.

基于模糊控制及遗传算法的人工免疫入侵检测算法

符海东赵建峰《计算机应用与软件》2008,25(7)

针对反向选择算法在面对大量的网络通信数据或具有多个分离特征区间网络通信数据时的无效性,提出了基于模糊控制及遗传算法的人工免疫入侵检测算法,利用模糊控制原理对抗体进行浓缩,并通过遗传算法进化种群,从而使得抗体的数量得到控制且检测效率较高. 相似文献

20.

基于小波逼近的空间机械臂非完整运动最优规划的遗传算法

张奇志戈新生刘延柱《机器人》1999,21(5):357-362

本文讨论了空间机械臂非完整运动规划问题．将空间机械臂非完整运动规划问题转化为非线性系统最优控制问题．在控制算法中用小波函数逼近控制输入规律．提出了空间机械臂非完整运动规划最优控制的遗传算法．数值仿真表明,小波逼近和遗传算法联合求解最优控制问题是有效的．相似文献