基于深度确定性策略梯度的智能车汇流模型 |
| |
引用本文: | 吴思凡,杜煜,徐世杰,杨硕,杜晨.基于深度确定性策略梯度的智能车汇流模型[J].计算机工程,2020,46(1):87-92. |
| |
作者姓名: | 吴思凡 杜煜 徐世杰 杨硕 杜晨 |
| |
作者单位: | 北京联合大学 智慧城市学院,北京 100101;北京联合大学 机器人学院,北京 100101;北京联合大学 北京市信息服务工程重点实验室,北京 100101 |
| |
摘 要: | 采用离散动作空间描述速度变化的智能车汇流模型不能满足实际车流汇入场景的应用要求,而深度确定性策略梯度(DDPG)结合策略梯度和函数近似方法,采用与深度Q网络(DQN)相同的网络结构,并使用连续动作空间对问题进行描述,更适合描述智能车速度变化。为此,提出一种基于DDPG算法的智能车汇流模型,将汇流问题转化为序列决策问题进行求解。实验结果表明,与基于DQN的模型相比,该模型的收敛速度较快,稳定性和成功率较高,更适合智能车汇入车辆场景的应用。
|
关 键 词: | 智能车 汇流 深度确定性策略梯度 深度Q网络 连续动作空间 |
Traffic Merging Model for Intelligent Vehicle Based on Deep Deterministic Policy Gradient |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|