首页 | 本学科首页   官方微博 | 高级检索  
     

基于增量式RBF网络的Q学习算法
引用本文:胡艳明,李德才,何玉庆,韩建达.基于增量式RBF网络的Q学习算法[J].机器人,2019,41(5):562-573.
作者姓名:胡艳明  李德才  何玉庆  韩建达
作者单位:中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016;中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016;中国科学院大学,北京 100049;中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016;中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016;中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016;中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016;南开大学人工智能学院,天津 300071
基金项目:国家自然科学基金;国家自然科学基金
摘    要:为提升机器人的行为智能水平,提出一种基于增量式径向基函数网络(IRBFN)的Q学习(IRBFN-QL)算法.其核心是通过结构的自适应增长与参数的在线学习,实现对Q值函数的学习与存储,从而使机器人可以在未知环境中自主增量式地学习行为策略.首先,采用近似线性独立(ALD)准则在线增加网络节点,使机器人的记忆容量伴随状态空间的拓展自适应增长.同时,节点的增加意味着网络拓扑内部连接的改变.采用核递归最小二乘(KRLS)算法更新网络拓扑连接关系及参数,使机器人不断扩展与优化自身的行为策略.此外,为避免过拟合问题,将L2正则项融合到KRLS算法中,得到L2约束下的核递归最小二乘算法(L2KRLS).实验结果表明,IRBFN-QL算法能够实现机器人与未知环境的自主交互,并逐步提高移动机器人在走廊环境中的导航行为能力.

关 键 词:核方法  最小二乘算法  增量式学习  移动机器人  Q学习
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号