基于对手动作预测的智能博弈对抗算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于对手动作预测的智能博弈对抗算法

引用本文：	韩润海,陈浩,刘权,黄健.基于对手动作预测的智能博弈对抗算法[J].计算机工程与应用,2023(7):190-197.

作者姓名：	韩润海陈浩刘权黄健

作者单位：	国防科技大学智能科学学院

摘要：	智能博弈对抗场景中，多智能体强化学习算法存在“非平稳性”问题，智能体的策略不仅取决于环境，还受到环境中对手（其他智能体）的影响。根据对手与环境的交互信息，预测其策略和意图，并以此调整智能体自身策略是缓解上述问题的有效方式。提出一种基于对手动作预测的智能博弈对抗算法，对环境中的对手进行隐式建模。该算法通过监督学习获得对手的策略特征，并将其与智能体的强化学习模型融合，缓解对手对学习稳定性的影响。在1v1足球环境中的仿真实验表明，提出的算法能够有效预测对手的动作，加快学习收敛速度，提升智能体的对抗水平。
关键词：	对手动作预测竞争双深度Q网络(D3QN) 智能博弈对抗深度强化学习