首页 | 本学科首页   官方微博 | 高级检索  
     

基于CMAC强化学习的交叉口信号控制
引用本文:温凯歌,杨照辉.基于CMAC强化学习的交叉口信号控制[J].计算机工程,2011,37(17):152-154.
作者姓名:温凯歌  杨照辉
作者单位:长安大学电子与控制工程学院,西安,710064
基金项目:中央高校基本科研业务费专项基金资助项目(CHD2009JC060)
摘    要:采用神经网络值函数逼近的强化学习方法处理交叉口的信号控制。根据交通流及交叉口信号特征,建立强化学习的状态空间、动作空间和回报空间,以最小化车辆在交叉口的延误为控制目标,对信号进行优化控制。引入小脑模型关节控制器神经网络对强化学习(RL)的Q值进行逼近。在变化的交通条件下,使用典型交叉口对提出的RL模型进行验证,同传统的定时控制和全感应控制进行对比分析。仿真结果表明,RL控制器具有较强的学习能力,可以适应交通流的动态变化,稳定性好、自适应性强,对于环境变化具有较强的适应能力。

关 键 词:交通控制  强化学习  小脑模型关节控制器  非均匀量化  信号交叉口
收稿时间:2011-02-23

Intersection Signal Control Based on Reinforcement Learning with CMAC
WEN Kai-ge,YANG zhao-hui.Intersection Signal Control Based on Reinforcement Learning with CMAC[J].Computer Engineering,2011,37(17):152-154.
Authors:WEN Kai-ge  YANG zhao-hui
Affiliation:WEN Kai-ge,YANG zhao-hui(School of Electronic and Control Engineering,Chang'an University,Xi'an 710064,China)
Abstract:The intersection signal control is disposed with the Reinforcement Learning(RL) method based on the neural network function approximate.Considering the stochastic characteristic of the traffic system,an adaptive RL control scheme,based on Cerebellar Model Articulation Controller(CMAC),is introduced in the traffic signal control systems.Besides,CMAC is introduced to approximate the RL agent Q value.The model is tested on a typical isolated traffic intersection comprised of five four-legged signalized interse...
Keywords:traffic control  reinforcement learning  Cerebellar Model Articulation Controller(CMAC)  non-uniform quantization  signal intersection  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号