首页 | 本学科首页   官方微博 | 高级检索  
     

融合LSTM的深度强化学习视觉导航
引用本文:袁浩,刘紫燕,梁静,梁水波,孙昊堃.融合LSTM的深度强化学习视觉导航[J].无线电工程,2022(1):161-167.
作者姓名:袁浩  刘紫燕  梁静  梁水波  孙昊堃
作者单位:;1.贵州大学大数据与信息工程学院
基金项目:贵州省科学技术基金资助项目(黔科合基础[2016]1054);贵州省联合资金资助项目(黔科合LH字[2017]7226号);贵州大学2017年度学术新苗培养及创新探索专项基金资助项目(黔科合平台人才[2017]5788);贵州省科技计划项目(黔科合SY字[2011]3111)。
摘    要:针对目标驱动的视觉导航系统中由于导航的场景变化而导致智能体导航性能大大减弱的问题,提出了一种基于长短时记忆网络(Long Short-Term Memory, LSTM)的深度强化学习(Deep Reinforcement Learning, DRL)视觉导航模型。该模型通过输入当前状态和目标状态的RGB图像来实现视觉导航,在改进原有目标驱动视觉导航模型的基础上,基于历史状态信息,结合LSTM和通用后继表征(Universal Successor Representations, USR)对未来动作决策。在AI2-THOR仿真环境下进行实验,实验结果表明,所提出的模型训练智能体导航性能优异,与其他几种模型相比,平均路径长度减少约6%,平均碰撞率减少40%,模型收敛速度较快。

关 键 词:视觉导航  深度强化学习  长短时记忆网络  目标驱动  通用后继表征

Visual Navigation Based on LSTM and Deep Reinforcement Learning
YUAN Hao,LIU Ziyan,LIANG Jing,LIANG Shuibo,SUN Hao.Visual Navigation Based on LSTM and Deep Reinforcement Learning[J].Radio Engineering of China,2022(1):161-167.
Authors:YUAN Hao  LIU Ziyan  LIANG Jing  LIANG Shuibo  SUN Hao
Affiliation:(College of Big Data and Information Engineering,Guizhou University,Guiyang 550025,China)
Abstract:
Keywords:visual navigation  deep reinforcement learning  LSTM  target driven  USR
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号