首页 | 本学科首页   官方微博 | 高级检索  
     

强化学习算法研究
引用本文:刘忠,李海红,刘全.强化学习算法研究[J].计算机工程与设计,2008,29(22).
作者姓名:刘忠  李海红  刘全
作者单位:1. 苏州大学,计算机科学与技术学院,江苏,苏州,215006
2. 浙江工业大学,信息学院,浙江,杭州,310014
3. 苏州大学,计算机科学与技术学院,江苏,苏州,215006;南京大学,软件新技术国家重点实验室,江苏,南京,210093
基金项目:国家自然科学基金项目,中国博士后科研基金项目,江苏省高校自然科学基金项目,江苏省博士后科研基金项目
摘    要:针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在莱状态下选择动作的策略以及无导师在线学习等特性.在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna,Prioritized Sweeping、Sarsa)的基础上,对TS(λ)、Q_learning的算法进行分析,并将其应用到实验中.实验结果表明,强化学习中的TS(λ)、Q_learning等算法在不同情况下都能高效地解决避障等问题.

关 键 词:强化学习  Q学习  Agent智能体  机器人控制  避障  搜索引擎

Research on algorithm of reinforcement learning
LIU Zhong,LI Hai-hong,LIU Quan.Research on algorithm of reinforcement learning[J].Computer Engineering and Design,2008,29(22).
Authors:LIU Zhong  LI Hai-hong  LIU Quan
Affiliation:LIU Zhong1,LI Hai-hong2,LIU Quan1,3(1.College of Computer Science , Technology,Soochow University,Suzhou 215006,China,2.College of Information Engineering,Zhejiang University of Technology,Hangzhou 310014,3.State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093,China)
Abstract:
Keywords:reinforcement learning  Q_learning  agent  robot control  obstacle avoidance  search engine  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号