首页 | 本学科首页   官方微博 | 高级检索  
     

基于对手动作预测的智能博弈对抗算法
引用本文:韩润海,陈浩,刘权,黄健.基于对手动作预测的智能博弈对抗算法[J].计算机工程与应用,2023(7):190-197.
作者姓名:韩润海  陈浩  刘权  黄健
作者单位:国防科技大学智能科学学院
摘    要:智能博弈对抗场景中,多智能体强化学习算法存在“非平稳性”问题,智能体的策略不仅取决于环境,还受到环境中对手(其他智能体)的影响。根据对手与环境的交互信息,预测其策略和意图,并以此调整智能体自身策略是缓解上述问题的有效方式。提出一种基于对手动作预测的智能博弈对抗算法,对环境中的对手进行隐式建模。该算法通过监督学习获得对手的策略特征,并将其与智能体的强化学习模型融合,缓解对手对学习稳定性的影响。在1v1足球环境中的仿真实验表明,提出的算法能够有效预测对手的动作,加快学习收敛速度,提升智能体的对抗水平。

关 键 词:对手动作预测  竞争双深度Q网络(D3QN)  智能博弈对抗  深度强化学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号