首页 | 本学科首页   官方微博 | 高级检索  
     

基于Q-学习的进化博弈决策模型
引用本文:刘伟兵,黎民,王先甲. 基于Q-学习的进化博弈决策模型[J]. 武汉大学学报(工学版), 2008, 41(4)
作者姓名:刘伟兵  黎民  王先甲
作者单位:1. 武汉大学政治与公共管理学院,湖北,武汉,430072
2. 武汉大学系统工程研究所,湖北,武汉,430072
摘    要:基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可用于不完全、不确定信息问题,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中两种Q-学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.

关 键 词:进化博弈  强化学习  Q-学习  决策模型

Decision-models in evolutionary games based on Q-learning
LIU Weibing,LI Min,WANG Xianjia. Decision-models in evolutionary games based on Q-learning[J]. Engineering Journal of Wuhan University, 2008, 41(4)
Authors:LIU Weibing  LI Min  WANG Xianjia
Abstract:Based on Q-reinforcement learning,decision-models of agents in evolutionary games are established.Considering that the reinforcement learning does not need a model of its environment,and it can be used in problems with incomplete and uncertain information,Q-learning is introduced to evolutionary games;and the single-agent Q-learning decision-model and the multi-agent Q-learning decision-model are presented.In addition,how to choose decision-models and algorithms according to the type of games is discussed.The results of simulation experiments show that the decision-models based on Q-learning can make agents to choose the optimal strategy by learning.
Keywords:evolutionary game  reinforcement learning  Q-learning  decision model
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号