首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度强化学习的有轨电车信号优先控制
引用本文:王云鹏, 郭戈. 基于深度强化学习的有轨电车信号优先控制. 自动化学报, 2019, 45(12): 2366−2377 doi: 10.16383/j.aas.c190164
作者姓名:王云鹏  郭戈
作者单位:1.大连理工大学控制科学与工程学院 大连 116024;;2.东北大学流程工业综合自动化国家重点实验室 沈阳 110819;;3.东北大学秦皇岛分校控制工程学院 秦皇岛 066004
基金项目:国家自然科学基金(61573077, U1808205)资助
摘    要:
现有的有轨电车信号优先控制系统存在诸多问题, 如无法适应实时交通变化、优化求解较为复杂等. 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略. 不依赖于交叉口复杂交通建模, 采用实时交通信息作为输入, 在有轨电车整个通行过程中连续动态调整交通信号. 协同考虑有轨电车与社会车辆的通行需求, 在尽量保证有轨电车无需停车的同时, 降低社会车辆的通行延误. 采用深度Q网络算法进行问题求解, 并利用竞争架构、双Q网络和加权样本池改善学习性能. 基于SUMO的实验表明, 该模型能够有效地协同提高有轨电车与社会车辆的通行效率.


关 键 词:有轨电车   信号优先   马尔科夫决策过程   深度强化学习
收稿时间:2019-03-15
点击此处可从《自动化学报》浏览原始摘要信息
点击此处可从《自动化学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号