基于深度强化学习的移动机器人动态路径规划算法 |
| |
作者姓名: | 张柏鑫 杨毅镔 朱华中 刘安东 倪洪杰 |
| |
作者单位: | 浙江工业大学,,,浙江工业大学, |
| |
基金项目: | 国家自然科学基金项目 (61973275) |
| |
摘 要: | 为了在复杂舞台环境下使用移动机器人实现物品搬运或者载人演出,提出了一种基于深度强化学习的动态路径规划算法。首先通过构建全局地图获取移动机器人周围的障碍物信息,将演员和舞台道具分别分类成动态障碍物和静态障碍物。然后建立局部地图,通过LSTM网络编码动态障碍物信息,使用社会注意力机制计算每个动态障碍物的重要性来实现更好的避障效果。通过构建新的奖励函数来实现对动静态障碍物的不同躲避情况。最后通过模仿学习和优先级经验回放技术来提高网络的收敛速度,从而实现在舞台复杂环境下的移动机器人的动态路径规划。实验结果表明,该网络的收敛速度明显提高,在不同障碍物环境下都能够表现出好的动态避障效果。
|
关 键 词: | 移动机器人 LSTM 深度强化学习 动态路径规划 实时避障 |
收稿时间: | 2022-06-11 |
修稿时间: | 2022-07-09 |
|
| 点击此处可从《计算机测量与控制》浏览原始摘要信息 |
|
点击此处可从《计算机测量与控制》下载全文 |
|