基于深度强化学习的有轨电车信号优先控制 |
| |
引用本文: | 王云鹏, 郭戈. 基于深度强化学习的有轨电车信号优先控制. 自动化学报, 2019, 45(12): 2366−2377 doi: 10.16383/j.aas.c190164 |
| |
作者姓名: | 王云鹏 郭戈 |
| |
作者单位: | 1.大连理工大学控制科学与工程学院 大连 116024;;2.东北大学流程工业综合自动化国家重点实验室 沈阳 110819;;3.东北大学秦皇岛分校控制工程学院 秦皇岛 066004 |
| |
基金项目: | 国家自然科学基金(61573077, U1808205)资助 |
| |
摘 要: |  现有的有轨电车信号优先控制系统存在诸多问题, 如无法适应实时交通变化、优化求解较为复杂等. 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略. 不依赖于交叉口复杂交通建模, 采用实时交通信息作为输入, 在有轨电车整个通行过程中连续动态调整交通信号. 协同考虑有轨电车与社会车辆的通行需求, 在尽量保证有轨电车无需停车的同时, 降低社会车辆的通行延误. 采用深度Q网络算法进行问题求解, 并利用竞争架构、双Q网络和加权样本池改善学习性能. 基于SUMO的实验表明, 该模型能够有效地协同提高有轨电车与社会车辆的通行效率.

|
关 键 词: | 有轨电车 信号优先 马尔科夫决策过程 深度强化学习 |
收稿时间: | 2019-03-15 |
|
| 点击此处可从《自动化学报》浏览原始摘要信息 |
|
点击此处可从《自动化学报》下载免费的PDF全文 |
|