排序方式: 共有2条查询结果,搜索用时 5 毫秒
1
1.
BDI模型能够很好地解决在特定环境下的Agent的推理和决策问题,但在动态和不确定环境下缺少决策和学习的能力。强化学习解决了Agent在未知环境下的决策问题,却缺少BDI模型中的规则描述和逻辑推理。针对BDI在未知和动态环境下的策略规划问题,提出基于强化学习Q-learning算法来实现BDI Agent学习和规划的方法,并针对BDI的实现模型ASL的决策机制做出了改进,最后在ASL的仿真平台Jason上建立了迷宫的仿真,仿真实验表明,在加入Q-learning学习机制后的新的ASL系统中,Agent在不确定环境下依然可以完成任务。 相似文献
2.
面向开放多智能体系统OMAS的自适应性体现在多Agent通过协作在运行时调整系统行为以适应环境的变化。针对现有多Agent设计时预定义协作机制无法满足运行时自适应协作的问题,提出了一种基于目标-能力-承诺GCC元模型生成自适应多Agent能力承诺协作图规划协议CCGP的算法。首先提出支持上下文环境语义相似度计算的GCC模型;然后将目标与能力(或者承诺)间的语义匹配度引入到基于能力协作的图规划协议中生成优化算法;最后以医疗垃圾AGV运输仿真系统为实验场景进行2组对比实验,实验结果表明CCGP算法对于生成图规划协议的执行时间有明显提高。 相似文献
1