基于深度强化学习的无地图移动机器人导航 |
| |
作者姓名: | 户高铭 蔡克卫 王芳 康玉伟 张家旭 金兆一 林远山 |
| |
作者单位: | 大连海洋大学 信息工程学院,辽宁 大连 116023;大连海洋大学 设施渔业教育部重点实验室,辽宁 大连 116023;辽宁省海洋信息技术重点实验室,辽宁 大连 116023;大连民族大学机电工程学院,辽宁 大连 116023 |
| |
基金项目: | 国家自然科学基金项目(61603067);辽宁省自然科学基金项目(2020-KF-12-09);大连市高层次人才创新支持计划项目(2017RQ053);辽宁省重点研发计划项目(2020JH2/10100043);辽宁省教育厅基金项目(LJKZ0730,QL202016,JL202015). |
| |
摘 要: | 针对传统导航方法对地图精度依赖和动态复杂场景适应差问题,提出一种基于课程学习的深度强化学习无地图自主导航算法.为了克服智能体稀疏奖励情况下学习困难的问题,借鉴课程学习思想,提出一种基于能力圈课程引导的深度强化学习训练方法.此外,为了更好地利用机器人当前的碰撞信息辅助机器人做动作决策,引入碰撞概率的概念,将机器人当前感知到的障碍物信息以一种高层语义的形式进行表示,并将其作为导航策略输入的一部分编码至机器人当前观测中,以简化观测到动作的映射,进一步降低学习的难度.实验结果表明,所提出的课程引导训练和碰撞概率可令导航策略收敛速度明显加快,习得的导航策略在空间更大的场景成功率到达90%以上,行驶耗时减少53.5%sim73.1%,可为非结构化未知环境下的无人化作业提供可靠导航.
|
关 键 词: | 移动机器人 自主导航 无地图导航 深度强化学习 课程学习 |
|
| 点击此处可从《控制与决策》浏览原始摘要信息 |
|
点击此处可从《控制与决策》下载免费的PDF全文 |
|