首页 | 本学科首页   官方微博 | 高级检索  
     

基于强化学习的自动驾驶汽车换道决策研究
作者姓名:姜文鑫  吴志周  许宏鑫  梁韵逸
作者单位:1.新疆大学智能制造现代产业学院;2.新疆大学交通运输工程学院;3.同济大学交通运输工程学院;4.上海理工大学管理学院
基金项目:新一代人工智能国家科技重大专项 2022ZD0115600;国家自然科学基金 52172330,52002281;湖南省自然科学基金 2023JJ40731
摘    要:换道作为车辆行驶的常见行为之一;操作不当极易引发交通事故。针对自动驾驶汽车的换道决策问题;提出了一种基于强化学习的DDQN(双深度Q网络)模型;该模型通过离散动作空间;结合驾驶舒适性、效率、安全性和换道惩罚四个方面设计奖励函数;以优化换道决策。为验证换道决策模型的性能;基于SUMO和真实高速公路车辆数据集搭建高速公路场景下的仿真模型。对比实验结果表明;DDQN模型在驾驶舒适性、交通效率、任务成功率及车辆平均行程速度方面均优于传统的DQN(深度Q网络)和Dueling DQN(对决深度Q网络)模型;且换道次数较少。此外;在四种不同交通拥堵场景下的实验结果显示;DDQN模型在不同拥堵情况下均保持了良好的性能;任务成功率均超过75%。研究表明;基于强化学习的DDQN算法能够为自动驾驶汽车提供有效的换道决策支持。

关 键 词:自动驾驶  换道决策  强化学习  马尔可夫决策过程  
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号