基于深度确定性策略梯度的智能车汇流模型 Traffic Merging Model for Intelligent Vehicle Based on Deep Deterministic Policy Gradient期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度确定性策略梯度的智能车汇流模型

引用本文：	吴思凡,杜煜,徐世杰,杨硕,杜晨.基于深度确定性策略梯度的智能车汇流模型[J].计算机工程,2020,46(1):87-92.

作者姓名：	吴思凡杜煜徐世杰杨硕杜晨

作者单位：	北京联合大学智慧城市学院,北京 100101;北京联合大学机器人学院,北京 100101;北京联合大学北京市信息服务工程重点实验室,北京 100101

摘要：	采用离散动作空间描述速度变化的智能车汇流模型不能满足实际车流汇入场景的应用要求,而深度确定性策略梯度(DDPG)结合策略梯度和函数近似方法,采用与深度Q网络(DQN)相同的网络结构,并使用连续动作空间对问题进行描述,更适合描述智能车速度变化。为此,提出一种基于DDPG算法的智能车汇流模型,将汇流问题转化为序列决策问题进行求解。实验结果表明,与基于DQN的模型相比,该模型的收敛速度较快,稳定性和成功率较高,更适合智能车汇入车辆场景的应用。
关键词：	智能车汇流深度确定性策略梯度深度Q网络连续动作空间
Traffic Merging Model for Intelligent Vehicle Based on Deep Deterministic Policy Gradient

Abstract:

Keywords:
本文献已被万方数据等数据库收录！