融合LSTM的深度强化学习视觉导航 Visual Navigation Based on LSTM and Deep Reinforcement Learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合LSTM的深度强化学习视觉导航

引用本文：	袁浩,刘紫燕,梁静,梁水波,孙昊堃.融合LSTM的深度强化学习视觉导航[J].无线电工程,2022(1):161-167.

作者姓名：	袁浩刘紫燕梁静梁水波孙昊堃

作者单位：	;1.贵州大学大数据与信息工程学院

基金项目：	贵州省科学技术基金资助项目(黔科合基础[2016]1054);贵州省联合资金资助项目(黔科合LH字[2017]7226号);贵州大学2017年度学术新苗培养及创新探索专项基金资助项目(黔科合平台人才[2017]5788);贵州省科技计划项目(黔科合SY字[2011]3111)。

摘要：	针对目标驱动的视觉导航系统中由于导航的场景变化而导致智能体导航性能大大减弱的问题,提出了一种基于长短时记忆网络(Long Short-Term Memory, LSTM)的深度强化学习(Deep Reinforcement Learning, DRL)视觉导航模型。该模型通过输入当前状态和目标状态的RGB图像来实现视觉导航,在改进原有目标驱动视觉导航模型的基础上,基于历史状态信息,结合LSTM和通用后继表征(Universal Successor Representations, USR)对未来动作决策。在AI2-THOR仿真环境下进行实验,实验结果表明,所提出的模型训练智能体导航性能优异,与其他几种模型相比,平均路径长度减少约6%,平均碰撞率减少40%,模型收敛速度较快。
关键词：	视觉导航深度强化学习长短时记忆网络目标驱动通用后继表征
Visual Navigation Based on LSTM and Deep Reinforcement Learning

YUAN Hao,LIU Ziyan,LIANG Jing,LIANG Shuibo,SUN Hao.Visual Navigation Based on LSTM and Deep Reinforcement Learning[J].Radio Engineering of China,2022(1):161-167.

Authors:	YUAN Hao LIU Ziyan LIANG Jing LIANG Shuibo SUN Hao

Affiliation:	(College of Big Data and Information Engineering,Guizhou University,Guiyang 550025,China)

Abstract:

Keywords:	visual navigation deep reinforcement learning LSTM target driven USR
本文献已被维普等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏