基于局部位置感知的多智能体网约车调度方法 |
| |
引用本文: | 黄晓辉,凌嘉壕,张雄,熊李艳,曾辉.基于局部位置感知的多智能体网约车调度方法[J].计算机工程与应用,2023(7):294-301. |
| |
作者姓名: | 黄晓辉 凌嘉壕 张雄 熊李艳 曾辉 |
| |
作者单位: | 华东交通大学信息工程学院 |
| |
基金项目: | 国家自然科学基金(62062033,62067002);;江西省自然科学基金面上项目(20212BAB202008); |
| |
摘 要: | 近年来,网上约车成为人们日常出行不可或缺的一部分。网约车平台的核心任务是如何有效地把订单派送给合适的司机,使得用户总体等待时间尽可能短,而司机的收益尽可能高。在目前的研究中,主要采用贪心算法以及强化学习来构建模型。但当前方法大都只考虑乘客的即时满意度,未能有效地考虑车辆、订单之间相对位置关系,从长远的角度来降低全体乘客的等待时间。为此,将订单派送构建为一个马尔可夫过程,提出了一种基于局部位置感知的多智能体的车辆调度方法。该方法通过设计合适的输入状态和卷积神经网络来捕捉人与车的时空关系,从长远角度来降低乘客的总体等待时间。实验结果表明,在不同规格的地图、不同数量的车辆和订单的场景中,提出的方法均优于现有的研究方法,并且拥有更好的泛化能力。特别是在大规模人车环境的复杂场景中,该方法所取得的结果要明显优于现有方法。
|
关 键 词: | 多智能体强化学习 车辆调度 局部感知 深度强化学习 |
|
|