首页 | 本学科首页   官方微博 | 高级检索  
     

多智能体同时到达多目标点的协同强化学习算法
引用本文:李瑞群,王若冰,田涛,郑重,张越.多智能体同时到达多目标点的协同强化学习算法[J].计算机应用与软件,2021,38(9):199-204.
作者姓名:李瑞群  王若冰  田涛  郑重  张越
作者单位:中国航天系统科学与工程研究院 北京100048;中国航天系统科学与工程研究院 北京100048;航天宏康智能科技(北京)有限公司 北京100048;航天宏康智能科技(北京)有限公司 北京100048
基金项目:广东省科技厅应用型研发基金
摘    要:针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进.智能体与环境交互,不断重复"探索-学习-决策"过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点.仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高约42.86%,同时智能体能够获得更多的奖励,可以做到自主决策自主分配目标,并且实现同时到达所有目标点的目标.

关 键 词:多智能体  多目标  同时到达  协同避障  强化学习

COLLABORATIVE REINFORCEMENT LEARNING ALGORITHM OF MULTI-AGENT ACHIEVING SIMULTANEOUS MULTI-OBJECTIVES
Li Ruiqun,Wang Ruobing,Tian Tao,Zheng Zhong,Zhang Yue.COLLABORATIVE REINFORCEMENT LEARNING ALGORITHM OF MULTI-AGENT ACHIEVING SIMULTANEOUS MULTI-OBJECTIVES[J].Computer Applications and Software,2021,38(9):199-204.
Authors:Li Ruiqun  Wang Ruobing  Tian Tao  Zheng Zhong  Zhang Yue
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号