基于DDPG的无人机追捕任务泛化策略设计期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于DDPG的无人机追捕任务泛化策略设计

引用本文：	符小卫,徐哲,王辉.基于DDPG的无人机追捕任务泛化策略设计[J].西北工业大学学报,2022(1):47-55.

作者姓名：	符小卫徐哲王辉

作者单位：	西北工业大学电子信息学院

基金项目：	航空科学基金(2020Z023053001)资助；

摘要：	无人机追逃对抗问题是当今空战领域的研究热点，传统解决方案对此问题存在诸多限制，如模型难以适应复杂动态环境从而快速做出决策、对不同任务场景泛化性较差等问题。基于DDPG(deep deterministic policy gradient)算法设计了无人机追逃对抗策略；在此基础上，设计多种逃逸无人机的对抗机动策略，利用课程学习思想，在DDPG的训练过程中逐步提高逃逸无人机的智能程度，从而递进式地训练追捕无人机的对抗策略。仿真结果表明，相较于直接进行训练，利用课程学习的方法所训练的追捕无人机的追捕策略能够更快收敛，并能更好地执行对敌机的追捕任务，且能够适用于具有多种对抗机动策略的敌机，有效地提升了无人机追逃对抗决策模型的泛化性。
关键词：	无人机追逃对抗深度强化学习 DDPG 课程学习