一种多动机强化学习框架 A Multi-Motive Reinforcement Learning Framework期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种多动机强化学习框架

引用本文：	赵凤飞,覃征. 一种多动机强化学习框架[J]. 计算机研究与发展, 2013, 50(2): 240-247

作者姓名：	赵凤飞覃征

作者单位：	清华大学计算机科学与技术系北京 100084

基金项目：	国防“十一五”预研基金项目(402040202);国防“十二五”预研基金项目(041802008)

摘要：	以Q学习为代表的传统强化学习方法都是维持一个状态与动作的映射表.这种状态-动作的二层映射结构缺乏灵活性,同时不能有效地使用先验知识引导学习过程.为了解决这一问题,提出了一种基于多动机强化学习(MMRL)的框架.MMRL框架在状态与动作间引入动机层,将原有的状态-动作二层结构扩展为状态-动机-动作三层结构,可根据经验设置多个动机.通过动机的设定实现了先验知识的利用,进而加快了强化学习的进程,提高了强化学习的灵活性.实验表明,通过合理的动机设定,多动机强化学习的学习速度较传统强化学习有明显提升.
关键词：	强化学习多动机 Q学习 MMQ—unique算法 MMQ-voting算法
A Multi-Motive Reinforcement Learning Framework

Zhao Fengfei , Qin Zheng. A Multi-Motive Reinforcement Learning Framework[J]. Journal of Computer Research and Development, 2013, 50(2): 240-247

Authors:	Zhao Fengfei Qin Zheng

Affiliation:	Zhao Fengfei and Qin Zheng (Department of Computer Science and Technology, Tsinghua University, Beijing 100084)

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏