强化学习算法研究 Research on algorithm of reinforcement learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

强化学习算法研究

引用本文：	刘忠,李海红,刘全.强化学习算法研究[J].计算机工程与设计,2008,29(22).

作者姓名：	刘忠李海红刘全

作者单位：	1. 苏州大学,计算机科学与技术学院,江苏,苏州,215006 2. 浙江工业大学,信息学院,浙江,杭州,310014 3. 苏州大学,计算机科学与技术学院,江苏,苏州,215006;南京大学,软件新技术国家重点实验室,江苏,南京,210093

基金项目：	国家自然科学基金项目，中国博士后科研基金项目，江苏省高校自然科学基金项目，江苏省博士后科研基金项目

摘要：	针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在莱状态下选择动作的策略以及无导师在线学习等特性.在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna,Prioritized Sweeping、Sarsa)的基础上,对TS(λ)、Q_learning的算法进行分析,并将其应用到实验中.实验结果表明,强化学习中的TS(λ)、Q_learning等算法在不同情况下都能高效地解决避障等问题.
关键词：	强化学习 Q学习 Agent智能体机器人控制避障搜索引擎
Research on algorithm of reinforcement learning

LIU Zhong,LI Hai-hong,LIU Quan.Research on algorithm of reinforcement learning[J].Computer Engineering and Design,2008,29(22).

Authors:	LIU Zhong LI Hai-hong LIU Quan

Affiliation:	LIU Zhong1,LI Hai-hong2,LIU Quan1,3(1.College of Computer Science , Technology,Soochow University,Suzhou 215006,China,2.College of Information Engineering,Zhejiang University of Technology,Hangzhou 310014,3.State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093,China)

Abstract:

Keywords:	reinforcement learning Q_learning agent robot control obstacle avoidance search engine
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏