基于Q-learning的不确定环境BDI Agent最优策略规划研究 Optimal strategy planning of BDI agent based on Q-learning in uncertain environments期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于Q-learning的不确定环境BDI Agent最优策略规划研究

引用本文：	万谦,刘玮,徐龙龙,郭竞知.基于Q-learning的不确定环境BDI Agent最优策略规划研究[J].计算机工程与科学,2019,41(1):166-172.

作者姓名：	万谦刘玮徐龙龙郭竞知

作者单位：	武汉工程大学计算机科学与工程学院,湖北武汉 430073;智能机器人湖北省重点实验室,湖北武汉 430073;武汉工程大学计算机科学与工程学院,湖北武汉 430073;智能机器人湖北省重点实验室,湖北武汉 430073;武汉工程大学计算机科学与工程学院,湖北武汉 430073;智能机器人湖北省重点实验室,湖北武汉 430073;武汉工程大学计算机科学与工程学院,湖北武汉 430073;智能机器人湖北省重点实验室,湖北武汉 430073

基金项目：	国家自然科学基金（61502355）；武汉工程大学第九届研究生教育创新基金(CX2017068)

摘要：	BDI模型能够很好地解决在特定环境下的Agent的推理和决策问题,但在动态和不确定环境下缺少决策和学习的能力。强化学习解决了Agent在未知环境下的决策问题,却缺少BDI模型中的规则描述和逻辑推理。针对BDI在未知和动态环境下的策略规划问题,提出基于强化学习Q-learning算法来实现BDI Agent学习和规划的方法,并针对BDI的实现模型ASL的决策机制做出了改进,最后在ASL的仿真平台Jason上建立了迷宫的仿真,仿真实验表明,在加入Q-learning学习机制后的新的ASL系统中,Agent在不确定环境下依然可以完成任务。
关键词：	BDIAgent 强化学习 Q-LEARNING ASL JASON 规划
收稿时间：	2018-06-05
修稿时间：	2019-01-25
Optimal strategy planning of BDI agent based on Q-learning in uncertain environments

WAN Qian,LIU Wei,XU Long long,GUO Jing zhi.Optimal strategy planning of BDI agent based on Q-learning in uncertain environments[J].Computer Engineering & Science,2019,41(1):166-172.

Authors:	WAN Qian LIU Wei XU Long long GUO Jing zhi

Affiliation:	（1.School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430073; 2.Hubei Provincial Key Laboratory of Intelligent Robot,Wuhan 430073,China）

Abstract:

Keywords:	BDI agent reinforcement learning Q-learning ASL Jason planning
本文献已被维普万方数据等数据库收录！
	点击此处可从《计算机工程与科学》浏览原始摘要信息
	点击此处可从《计算机工程与科学》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏