Q—学习及其在智能机器人局部路径规划中的应用研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Q—学习及其在智能机器人局部路径规划中的应用研究

引用本文：	张汝波,杨广铭.Q—学习及其在智能机器人局部路径规划中的应用研究[J].计算机研究与发展,1999,36(12):1430-1436.

作者姓名：	张汝波杨广铭

摘要：	强化学习－词来自于行为心理学，这门学科把行为学习看成反复试验的过程，从而把环境状态映射成相应的动作。在设计智能机器人过程中，如何来实现行为主义的思想、在与环境的交互中学习行为动作？文中把机器人在未知环境中为躲避障碍所采取的动作看作一种行为，有杉强化学习方法来实现智能机器人避碰行为学习。Ｑ－学习算法是类似于动态规划的一种强化学习方法，文中在介绍了Ｑ－学习的基本算法之后，提出了具有竞争思想和自组织机制
关键词：	局部路径规划智能机器人神经网络 Q－学习
修稿时间：
本文献已被维普等数据库收录！