Q—学习及其在智能机器人局部路径规划中的应用研究 |
| |
引用本文: | 张汝波,杨广铭.Q—学习及其在智能机器人局部路径规划中的应用研究[J].计算机研究与发展,1999,36(12):1430-1436. |
| |
作者姓名: | 张汝波 杨广铭 |
| |
摘 要: | 强化学习-词来自于行为心理学,这门学科把行为学习看成反复试验的过程,从而把环境状态映射成相应的动作。在设计智能机器人过程中,如何来实现行为主义的思想、在与环境的交互中学习行为动作?文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为,有杉强化学习方法来实现智能机器人避碰行为学习。Q-学习算法是类似于动态规划的一种强化学习方法,文中在介绍了Q-学习的基本算法之后,提出了具有竞争思想和自组织机制
|
关 键 词: | 局部路径规划 智能机器人 神经网络 Q-学习 |
修稿时间: | |
本文献已被 维普 等数据库收录! |
|