基于不完备信息预测的多智能体分布式协同 |
| |
引用本文: | 张宏达,李德才,何玉庆.基于不完备信息预测的多智能体分布式协同[J].信息与控制,2024(1):86-97. |
| |
作者姓名: | 张宏达 李德才 何玉庆 |
| |
作者单位: | 1. 中国科学院沈阳自动化研究所机器人学国家重点实验室;2. 中国科学院机器人与智能制造创新研究院;3. 中国科学院大学 |
| |
基金项目: | 国家自然科学基金项目(61991413,91948202,91848203,91948303); |
| |
摘 要: | 为了解决部分可观对抗环境中多智能体协同决策难题,受人大脑皮层通过记忆进行学习和推理功能启发,提出一种新的部分可观对抗环境下基于不完备信息预测的多智能体分布式协同决策框架。该框架可采用支持向量回归等多种预测方法通过历史记忆和当前观察信息对环境中不可见信息进行预测,并将预测信息和观察到的信息融合,作为协同决策的依据;再通过分布式多智能体强化学习进行协同策略学习得到团队中每个智能体的决策模型。使用该框架结合多种预测算法在典型的部分可观对抗环境中进行了多智能体协同决策的验证。结果表明,提出的框架对多种预测算法具有普适性,且在保证对不可见部分高预测精度时能将多智能体协同决策水平提升23.4%。
|
关 键 词: | 多智能体协同 部分可观 信息预测 分布式协同决策 对抗环境 |
|
|