布洛托上校博弈模型及求解方法研究进展期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

布洛托上校博弈模型及求解方法研究进展

作者姓名：	罗俊仁邹明我陈少飞张万鹏陈璟

作者单位：	国防科技大学智能科学学院

基金项目：	国家自然科学基金(61806212)；

摘要：	对抗条件下的资源分配是大多数博弈决策问题的核心。从拟合最优解到博弈均衡解，基于博弈论的资源分配策略求解是认知决策领域的前沿课题。文中围绕对抗条件下资源分配的布洛托上校博弈模型和求解方法展开综述分析。首先，简要介绍了离线与在线策略学习的区别，策略博弈与相关解概念，在线优化与遗憾值；其次，梳理了6类布洛托上校博弈典型模型(连续布洛托上校博弈、离散布洛托上校博弈、广义布洛托上校博弈、广义乐透布洛托博弈、广义规则布洛托上校博弈与在线离散布洛托上校博弈);然后，区分2个阶段(离线与在线)3类博弈场景(单次、重复、多阶段),分析了多类布洛托上校博弈求解方法；最后，从典型应用探索、广义博弈模型、博弈求解方法、未来研究展望共4方面进行了未来研究前沿分析及展望。通过对当前布洛托上校博弈进行概述，期望能为对抗条件下资源分配与博弈论相关领域的研究带来启发。
关键词：	资源分配布洛托上校博弈近似纳什均衡在线凸优化期望遗憾高概率遗憾