基于对手动作预测的智能博弈对抗算法 |
| |
引用本文: | 韩润海,陈浩,刘权,黄健.基于对手动作预测的智能博弈对抗算法[J].计算机工程与应用,2023(7):190-197. |
| |
作者姓名: | 韩润海 陈浩 刘权 黄健 |
| |
作者单位: | 国防科技大学智能科学学院 |
| |
摘 要: | 智能博弈对抗场景中,多智能体强化学习算法存在“非平稳性”问题,智能体的策略不仅取决于环境,还受到环境中对手(其他智能体)的影响。根据对手与环境的交互信息,预测其策略和意图,并以此调整智能体自身策略是缓解上述问题的有效方式。提出一种基于对手动作预测的智能博弈对抗算法,对环境中的对手进行隐式建模。该算法通过监督学习获得对手的策略特征,并将其与智能体的强化学习模型融合,缓解对手对学习稳定性的影响。在1v1足球环境中的仿真实验表明,提出的算法能够有效预测对手的动作,加快学习收敛速度,提升智能体的对抗水平。
|
关 键 词: | 对手动作预测 竞争双深度Q网络(D3QN) 智能博弈对抗 深度强化学习 |
|
|