Skinner 操作条件反射的一种仿生学习算法与机器人控制 A Bionic Learning Algorithm Based on Skinner's Operant Conditioning and Control of Robot期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Skinner 操作条件反射的一种仿生学习算法与机器人控制

引用本文：	任红格,阮晓钢.Skinner 操作条件反射的一种仿生学习算法与机器人控制[J].机器人,2010,32(1):1.

作者姓名：	任红格阮晓钢

作者单位：	北京工业大学电子信息与控制工程学院,北京,100124

基金项目：	国家863计划资助项目(2007AA04Z226);;国家自然科学基金资助项目(60774077);;北京市教委重点资助项目(KZ200810005002);;北京市人才强教计划项目;;高等学校博士学科点专项科研基金资助课题

摘要：	针对两轮自平衡机器人的运动平衡控制问题，提出了基于Skinner 操作条件反射理论的BP 神经网络与资格迹相结合的仿生自主学习算法作为两轮机器人的学习机制．该算法利用资格迹能解决延迟影响、加快学习速度和提高可靠性的特点，将其与BP 神经网络相结合构成复合学习算法，能够预测机器人将要获得的行为评价函数，并依据概率取向机制以一定的概率选择最大评价值对应的最优行为，从而使机器人能够在未知环境下通过与环境的交互、学习和训练，获得像人或动物一样的自主学习技能，实现对两轮机器人的运动平衡控制．最后，分别用基于 Skinner 操作条件反射理论的BP 算法和BP 资格迹复合算法对两轮机器人做了仿真实验并进行了比较．结果表明，基于Skinner 操作条件反射理论的BP 资格迹复合仿生自主学习算法的学习机制能够使机器人获得良好的动态性能和较快的学习速度，体现了机器人较强的自主学习技能和平衡控制能力．
关键词：	Skinner 操作条件反射资格迹自主学习平衡控制两轮机器人
A Bionic Learning Algorithm Based on Skinner's Operant Conditioning and Control of Robot

REN Hongge,RUAN Xiaogang.A Bionic Learning Algorithm Based on Skinner's Operant Conditioning and Control of Robot[J].Robot,2010,32(1):1.

Authors:	REN Hongge RUAN Xiaogang

Affiliation:	School of Electronic & Control Engineering;Beijing University of Technology;Beijing 100124;China

Abstract:	Aiming at the movement balance control problem of the two-wheeled self-balancing mobile robot,a bionic self-learning algorithm consisting of BP(backpropagation) neural network and eligibility traces based on Skinner's operant conditioning theory is put forward as a learning mechanism of the two-wheeled robot.The algorithm utilizes the characters of eligibility traces in resolving delay effect,increasing learning speed,and improving reliability and ability,so that the complex learning algorithm consisting of...

Keywords:	Skinner's operant conditioning eligibility trace self-learning balance control two-wheeled robot
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《机器人》浏览原始摘要信息
	点击此处可从《机器人》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏