排序方式: 共有6条查询结果,搜索用时 15 毫秒
1
1.
针对对抗环境下的海上舰船防空反导导弹目标分配问题, 本文提出了一种融合注意力机制的深度强化学习算法. 首先, 构建了舰船多类型导弹目标分配模型, 并结合目标多波次拦截特点将问题建模为马尔可夫决策过程.接着, 基于编码器–解码器框架搭建强化学习策略网络, 融合多头注意力机制对目标进行编码, 并在解码中结合整体目标和单个目标编码信息实现舰船可靠的导弹目标分配. 最后, 对导弹目标分配收益、分配时效以及策略网络训练过程进行了仿真实验. 实验结果表明, 本文方法能生成高收益的导弹目标分配方案, 相较于对比算法的大规模决策计算速度提高10%~94%, 同时其策略网络能够快速稳定收敛. 相似文献
2.
4.
随着红外目标探测和精确制导技术的广泛应用,传统军事目标面临严峻的生存压力。为此,各主要军事强国采取多种措施,竞相发展目标红外辐射特性控制技术,以降低被红外探测系统捕获的概率,达到红外隐身目的。光子晶体是一种人工超颖材料,可以根据需要,通过灵活地设计其结构,改变光子在其中的传输特性。文中运用一维光子晶体带隙理论,设计了一种控制目标红外辐射特性的结构,详细给出了设计方法。计算结果表明对3~5μm和8~12μm两个红外大气传输窗口,该结构对红外辐射的抑制最高可分别达到29和21dB,具有很好的红外辐射特性控制性能。本文所述方法除为飞行器提供红外隐身设计参考外,还可用于攻防对抗仿真中红外隐身目标特性的模拟。 相似文献
5.
为了有效求解多平台协同火力分配问题,根据“分而治之”的思想,基于任务分解策略将复杂的决策任务分解为子目标平台选择和子平台火力分配两个阶段,通过融合启发式算法和强化学习模型,提出一种新的强化学习求解方法(HARL),并以多平台联合火力打击为作战背景进行实验仿真.子目标平台选择层根据当前状态,基于强化学习策略选择攻击当前子目标最适合的火力平台;而子平台火力分配层则使用启发式算法为执行攻击任务的平台规划最优的火力分配方案.实验结果表明,融合启发式算法和强化学习的HARL方法相比于传统的强化学习算法武器消耗量减少15%以上,相比于经典的启发式算法求解时效性提升20%以上,表明该研究成果可为未来求解复杂作战决策问题提供有力的技术支持. 相似文献
6.
1