基于DDPG的无人机追捕任务泛化策略设计 |
| |
引用本文: | 符小卫,徐哲,王辉.基于DDPG的无人机追捕任务泛化策略设计[J].西北工业大学学报,2022(1):47-55. |
| |
作者姓名: | 符小卫 徐哲 王辉 |
| |
作者单位: | 西北工业大学电子信息学院 |
| |
基金项目: | 航空科学基金(2020Z023053001)资助; |
| |
摘 要: | 无人机追逃对抗问题是当今空战领域的研究热点,传统解决方案对此问题存在诸多限制,如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机追逃对抗策略;在此基础上,设计多种逃逸无人机的对抗机动策略,利用课程学习思想,在DDPG的训练过程中逐步提高逃逸无人机的智能程度,从而递进式地训练追捕无人机的对抗策略。仿真结果表明,相较于直接进行训练,利用课程学习的方法所训练的追捕无人机的追捕策略能够更快收敛,并能更好地执行对敌机的追捕任务,且能够适用于具有多种对抗机动策略的敌机,有效地提升了无人机追逃对抗决策模型的泛化性。
|
关 键 词: | 无人机 追逃对抗 深度强化学习 DDPG 课程学习 |
|
|