首页 | 本学科首页   官方微博 | 高级检索  
     

Skinner 操作条件反射的一种仿生学习算法与机器人控制
引用本文:任红格,阮晓钢.Skinner 操作条件反射的一种仿生学习算法与机器人控制[J].机器人,2010,32(1):1.
作者姓名:任红格  阮晓钢
作者单位:北京工业大学电子信息与控制工程学院,北京,100124
基金项目:国家863计划资助项目(2007AA04Z226);;国家自然科学基金资助项目(60774077);;北京市教委重点资助项目(KZ200810005002);;北京市人才强教计划项目;;高等学校博士学科点专项科研基金资助课题
摘    要:针对两轮自平衡机器人的运动平衡控制问题,提出了基于Skinner 操作条件反射理论的BP 神经网络 与资格迹相结合的仿生自主学习算法作为两轮机器人的学习机制.该算法利用资格迹能解决延迟影响、加快学习速 度和提高可靠性的特点,将其与BP 神经网络相结合构成复合学习算法,能够预测机器人将要获得的行为评价函数, 并依据概率取向机制以一定的概率选择最大评价值对应的最优行为,从而使机器人能够在未知环境下通过与环境的 交互、学习和训练,获得像人或动物一样的自主学习技能,实现对两轮机器人的运动平衡控制.最后,分别用基于 Skinner 操作条件反射理论的BP 算法和BP 资格迹复合算法对两轮机器人做了仿真实验并进行了比较.结果表明, 基于Skinner 操作条件反射理论的BP 资格迹复合仿生自主学习算法的学习机制能够使机器人获得良好的动态性能 和较快的学习速度,体现了机器人较强的自主学习技能和平衡控制能力.

关 键 词:Skinner  操作条件反射  资格迹  自主学习  平衡控制  两轮机器人

A Bionic Learning Algorithm Based on Skinner's Operant Conditioning and Control of Robot
REN Hongge,RUAN Xiaogang.A Bionic Learning Algorithm Based on Skinner's Operant Conditioning and Control of Robot[J].Robot,2010,32(1):1.
Authors:REN Hongge  RUAN Xiaogang
Affiliation:School of Electronic & Control Engineering;Beijing University of Technology;Beijing 100124;China
Abstract:Aiming at the movement balance control problem of the two-wheeled self-balancing mobile robot,a bionic self-learning algorithm consisting of BP(backpropagation) neural network and eligibility traces based on Skinner's operant conditioning theory is put forward as a learning mechanism of the two-wheeled robot.The algorithm utilizes the characters of eligibility traces in resolving delay effect,increasing learning speed,and improving reliability and ability,so that the complex learning algorithm consisting of...
Keywords:Skinner's operant conditioning  eligibility trace  self-learning  balance control  two-wheeled robot  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《机器人》浏览原始摘要信息
点击此处可从《机器人》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号