基于深度强化学习与自学习的多无人机近距空战机动策略生成算法 Maneuvering strategy generation algorithm for multi-UAV in close-range air combat based on deep reinforcement learning and self-play期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

引用本文：	孔维仁,周德云,赵艺阳,杨婉莎.基于深度强化学习与自学习的多无人机近距空战机动策略生成算法[J].控制理论与应用,2022,39(2):352-362.

作者姓名：	孔维仁周德云赵艺阳杨婉莎

作者单位：	西北工业大学,西北工业大学,西北工业大学,悉尼大学

基金项目：	国家自然科学基金项目(61603299, 61612385), 中央高校基本科研业务费专项资金项目(3102019ZX016)资助

摘要：	为解决多无人机近距空战机动决策问题,提出一种基于参数共享Q网络与虚拟自我对局的多无人机近距空战机动策略生成算法.首先,设计一种适用于不同无人机编队规模的混合马尔可夫博弈模型与多无人机机动决策策略生成强化学习框架一参数共享Q网络,并通过自编码器对状态空间进行压缩以提高策略学习效率.然后,使用虚拟自我对局方法使机动策略收敛...
关键词：	空战决策多无人机协同强化学习虚拟自我对局
收稿时间：	2021/2/3 0:00:00
修稿时间：	2021/6/7 0:00:00
Maneuvering strategy generation algorithm for multi-UAV in close-range air combat based on deep reinforcement learning and self-play

KONG Wei-ren,ZHOU De-yun,ZHAO Yi-yang and YANG Wan-sha.Maneuvering strategy generation algorithm for multi-UAV in close-range air combat based on deep reinforcement learning and self-play[J].Control Theory & Applications,2022,39(2):352-362.

Authors:	KONG Wei-ren ZHOU De-yun ZHAO Yi-yang and YANG Wan-sha

Affiliation:	Northwestern Polytechnical University,Northwestern Polytechnical University,Northwestern Polytechnical University,The University of Sydney

Abstract:

Keywords:	air combat decision-making multi-UAV cooperation reinforcement learning fictitious self-play

	点击此处可从《控制理论与应用》浏览原始摘要信息
	点击此处可从《控制理论与应用》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏