稀疏奖励下基于强化学习的异构多智能体对抗期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

稀疏奖励下基于强化学习的异构多智能体对抗

作者姓名：	王瑞星董诗音江飞龙黄胜全

作者单位：	1.哈尔滨工业大学深空探测基础研究中心150001;2.上海机电工程研究所201109;

基金项目：	中央军委装备发展部装备预研基金(JZX7Y20-190243001201)。

摘要：	文中在多智能体对抗问题研究过程中,采用强化学习为研究方法,以完全中心化训练架构为基础,选用基于策略的强化学习算法,针对领域研究中广泛存在的稀疏奖励问题,采用基于任务局部的奖励工程设定方法,以人为经验知识为导引,加速训练过程,提升训练结果.最后以对抗问题中典型的攻防对抗为场景进行了仿真实验,验证了方法的有效性.
关键词：	多智能体博弈强化学习稀疏奖励基于任务局部的奖励工程设定
本文献已被维普等数据库收录！