首页 | 本学科首页   官方微博 | 高级检索  
     

基于探索密度的Option子目标发现算法
引用本文:孟江华,朱纪洪,孙增圻.基于探索密度的Option子目标发现算法[J].模式识别与人工智能,2007,20(2).
作者姓名:孟江华  朱纪洪  孙增圻
作者单位:清华大学,计算机科学与技术系,智能技术与系统国家重点实验室,北京,100084
摘    要:提出状态探索密度的概念,通过检测状态对智能体探索环境能力的影响来发现学习的子目标并构建对应的Option.用该算法创建Option的再励学习算法能有效提高学习速度.算法具有和任务无关、不需要先验知识等优点,构造出的Option在同一环境下不同任务间可以直接共享.

关 键 词:递阶再励学习  Option  探索密度(ED)

Discovery Algorithm for Option Based on Exploration Density
MENG Jiang-Hua,ZHU Ji-Hong,SUN Zeng-Qi.Discovery Algorithm for Option Based on Exploration Density[J].Pattern Recognition and Artificial Intelligence,2007,20(2).
Authors:MENG Jiang-Hua  ZHU Ji-Hong  SUN Zeng-Qi
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号