强化学习算法中启发式回报函数的设计及其收敛性分析期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

强化学习算法中启发式回报函数的设计及其收敛性分析

作者姓名：	魏英姿赵明扬

作者单位：	中国科学院沈阳自动化所机器人学重点实验室,沈阳,110016;沈阳理工大学,沈阳,110168;中国科学院研究生,北京,100039;中国科学院沈阳自动化所机器人学重点实验室,沈阳,110016

基金项目：	中国科学院先进制造基地创新基金(F010120),973计划课题(2002CB312200)

摘要：	(中国科学院沈阳自动化所机器人学重点实验室沈阳110016)
关键词：	强化学习回报函数马尔可夫决策过程策略收敛性
本文献已被 CNKI 维普万方数据等数据库收录！