首页 | 本学科首页   官方微博 | 高级检索  
     

基于DDPG的无人机追捕任务泛化策略设计
引用本文:符小卫,徐哲,王辉.基于DDPG的无人机追捕任务泛化策略设计[J].西北工业大学学报,2022(1):47-55.
作者姓名:符小卫  徐哲  王辉
作者单位:西北工业大学电子信息学院
基金项目:航空科学基金(2020Z023053001)资助;
摘    要:无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机追逃对抗策略;在此基础上,设计多种逃逸无人机的对抗机动策略,利用课程学习思想,在DDPG的训练过程中逐步提高逃逸无人机的智能程度,从而递进式地训练追捕无人机的对抗策略。仿真结果表明,相较于直接进行训练,利用课程学习的方法所训练的追捕无人机的追捕策略能够更快收敛,并能更好地执行对敌机的追捕任务,且能够适用于具有多种对抗机动策略的敌机,有效地提升了无人机追逃对抗决策模型的泛化性。

关 键 词:无人机  追逃对抗  深度强化学习  DDPG  课程学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号