首页 | 本学科首页   官方微博 | 高级检索  
     

国产化环境下基于强化学习的地空协同作战仿真
作者姓名:李理  李旭光  郭凯杰  史超  陈昭文
作者单位:中国兵器工业计算机应用技术研究所车辆综合电子研发部
摘    要:以未来战场无人地空协同作战为需求牵引,面对军事领域实战场景匮乏、训练数据不足的实际问题,聚焦仿真环境下的深度强化学习方法,实现地空协同作战仿真中多智能体决策模型。在飞腾CPU和昆仑K200硬件平台与麒麟V10操作系统环境下搭建虚拟仿真环境,设置仿真环境状态表征、各智能体动作空间及奖励机制,构建基于深度确定性策略梯度算法的多智能体模型(MADDPG),通过仿真实验验证采用MADDPG算法能够使奖励值在地空协同作战仿真场景中逐渐收敛,从而证明该模型应用于地空协同作战的决策有效性。

关 键 词:地空协同作战  强化学习  深度确定性策略梯度算法  多智能体模型  国产化环境
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号