首页 | 本学科首页   官方微博 | 高级检索  
     

一种多动机强化学习框架
引用本文:赵凤飞,覃征. 一种多动机强化学习框架[J]. 计算机研究与发展, 2013, 50(2): 240-247
作者姓名:赵凤飞  覃征
作者单位:清华大学计算机科学与技术系 北京 100084
基金项目:国防“十一五”预研基金项目(402040202);国防“十二五”预研基金项目(041802008)
摘    要:以Q学习为代表的传统强化学习方法都是维持一个状态与动作的映射表.这种状态-动作的二层映射结构缺乏灵活性,同时不能有效地使用先验知识引导学习过程.为了解决这一问题,提出了一种基于多动机强化学习(MMRL)的框架.MMRL框架在状态与动作间引入动机层,将原有的状态-动作二层结构扩展为状态-动机-动作三层结构,可根据经验设置多个动机.通过动机的设定实现了先验知识的利用,进而加快了强化学习的进程,提高了强化学习的灵活性.实验表明,通过合理的动机设定,多动机强化学习的学习速度较传统强化学习有明显提升.

关 键 词:强化学习  多动机  Q学习  MMQ—unique算法  MMQ-voting算法

A Multi-Motive Reinforcement Learning Framework
Zhao Fengfei , Qin Zheng. A Multi-Motive Reinforcement Learning Framework[J]. Journal of Computer Research and Development, 2013, 50(2): 240-247
Authors:Zhao Fengfei    Qin Zheng
Affiliation:Zhao Fengfei and Qin Zheng (Department of Computer Science and Technology, Tsinghua University, Beijing 100084)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号