首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度强化学习与自学习的多无人机近距空战机动策略生成算法
引用本文:孔维仁,周德云,赵艺阳,杨婉莎.基于深度强化学习与自学习的多无人机近距空战机动策略生成算法[J].控制理论与应用,2022,39(2):352-362.
作者姓名:孔维仁  周德云  赵艺阳  杨婉莎
作者单位:西北工业大学,西北工业大学,西北工业大学,悉尼大学
基金项目:国家自然科学基金项目(61603299, 61612385), 中央高校基本科研业务费专项资金项目(3102019ZX016)资助
摘    要:为解决多无人机近距空战机动决策问题,提出一种基于参数共享Q网络与虚拟自我对局的多无人机近距空战机动策略生成算法.首先,设计一种适用于不同无人机编队规模的混合马尔可夫博弈模型与多无人机机动决策策略生成强化学习框架一参数共享Q网络,并通过自编码器对状态空间进行压缩以提高策略学习效率.然后,使用虚拟自我对局方法使机动策略收敛...

关 键 词:空战决策  多无人机协同  强化学习  虚拟自我对局
收稿时间:2021/2/3 0:00:00
修稿时间:2021/6/7 0:00:00

Maneuvering strategy generation algorithm for multi-UAV in close-range air combat based on deep reinforcement learning and self-play
KONG Wei-ren,ZHOU De-yun,ZHAO Yi-yang and YANG Wan-sha.Maneuvering strategy generation algorithm for multi-UAV in close-range air combat based on deep reinforcement learning and self-play[J].Control Theory & Applications,2022,39(2):352-362.
Authors:KONG Wei-ren  ZHOU De-yun  ZHAO Yi-yang and YANG Wan-sha
Affiliation:Northwestern Polytechnical University,Northwestern Polytechnical University,Northwestern Polytechnical University,The University of Sydney
Abstract:
Keywords:air combat decision-making  multi-UAV cooperation  reinforcement learning  fictitious self-play
点击此处可从《控制理论与应用》浏览原始摘要信息
点击此处可从《控制理论与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号