首页 | 本学科首页   官方微博 | 高级检索  
     

稀疏奖励下基于强化学习的异构多智能体对抗
作者姓名:王瑞星  董诗音  江飞龙  黄胜全
作者单位:1.哈尔滨工业大学深空探测基础研究中心150001;2.上海机电工程研究所201109;
基金项目:中央军委装备发展部装备预研基金(JZX7Y20-190243001201)。
摘    要:文中在多智能体对抗问题研究过程中,采用强化学习为研究方法,以完全中心化训练架构为基础,选用基于策略的强化学习算法,针对领域研究中广泛存在的稀疏奖励问题,采用基于任务局部的奖励工程设定方法,以人为经验知识为导引,加速训练过程,提升训练结果.最后以对抗问题中典型的攻防对抗为场景进行了仿真实验,验证了方法的有效性.

关 键 词:多智能体博弈  强化学习  稀疏奖励  基于任务局部的奖励工程设定
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号