共查询到20条相似文献,搜索用时 15 毫秒
1.
针对无监督学习网络模型对于特定的映射空间,期望产生特定的影响具有一定的局限性,提出了有监督的可生长结构的动态结构模型;该模型将动态结构模型与径向基函数网络结构有机结合,采用的是需要时生长的自组织生长算法,通过插入新的神经元、改变竞争层神经元间的连接以及调整层与层的连接权值,达到模型输出的精度要求,有效地解决了在输入特定的网络数据时,能产生期望的输出;该模型应用于两轮平衡机器人的平衡控制,经过仿真实验表明,该动态结构模型能够实现对两轮平衡机器人的平衡控制,且有一定的抗干扰性和实用价值。 相似文献
2.
3.
基于强化学习规则的两轮机器人自平衡控制 总被引:1,自引:0,他引:1
两轮机器人是一个典型的不稳定,非线性,强耦合的自平衡系统,在两轮机器人系统模型未知和没有先验经验的条件下,将强化学习算法和模糊神经网络有效结合,保证了函数逼近的快速性和收敛性,成功地实现两轮机器人的自学习平衡控制,并解决了两轮机器人连续状态空间和动作空间的强化学习问题;仿真和实验表明:该方法不仅在很短的时间内成功地完成对两轮机器人的平衡控制,而且在两轮机器人参数变化较大时,仍能维持两轮机器人的平衡。 相似文献
4.
神经元PID控制器在两轮机器人控制中的应用 总被引:1,自引:0,他引:1
针对两轮机器人传统PID控制器参数整定困难的问题,设计了一种神经元PID控制器.该控制器利用神经元的自学习和自适应能力,在线实时调整控制器各项参数.建立了两轮机器人的非线性模型,讨论了神经元PID控制系统的结构及其控制算法和各项控制器参数的学习算法.将设计的控制器其应用于两轮机器人的平衡控制中,并且与传统PID控制器进... 相似文献
5.
6.
针对两轮自平衡机器人的运动平衡控制问题,采用了基于Skinner操作条件反射理论的自回归神经网络学习算法作为机器人的学习机制,利用自回归神经网络对评价函数进行逼近,以实现对行为决策的优化,从而使机器人能够在无需外部环境模型的情况下,通过学习和训练,获得像人或动物一样的自主学习技能,解决了两轮机器人的运动平衡控制问题.最后分别在无扰动和有扰动的两种状态下设计了仿真实验并进行了比较.结果表明,该操作条件反射学习机制具有较快的自主平衡控制技能和较好的鲁棒性能,体现了较高的理论研究意义和工程应用价值. 相似文献
7.
Skinner 操作条件反射的一种仿生学习算法与机器人控制 总被引:1,自引:0,他引:1
针对两轮自平衡机器人的运动平衡控制问题,提出了基于Skinner 操作条件反射理论的BP 神经网络
与资格迹相结合的仿生自主学习算法作为两轮机器人的学习机制.该算法利用资格迹能解决延迟影响、加快学习速
度和提高可靠性的特点,将其与BP 神经网络相结合构成复合学习算法,能够预测机器人将要获得的行为评价函数,
并依据概率取向机制以一定的概率选择最大评价值对应的最优行为,从而使机器人能够在未知环境下通过与环境的
交互、学习和训练,获得像人或动物一样的自主学习技能,实现对两轮机器人的运动平衡控制.最后,分别用基于
Skinner 操作条件反射理论的BP 算法和BP 资格迹复合算法对两轮机器人做了仿真实验并进行了比较.结果表明,
基于Skinner 操作条件反射理论的BP 资格迹复合仿生自主学习算法的学习机制能够使机器人获得良好的动态性能
和较快的学习速度,体现了机器人较强的自主学习技能和平衡控制能力. 相似文献
8.
设计了一种模糊控制的四轮全位移平衡机器人,通过SolidWorks改进设计了基于麦克纳姆轮的全位移平衡底盘、双轴云台等机械结构。以Altium Designer为开发平台设计了STM32F405核心板主控,外设电路设计主要包括:ICM20948传感器电路、CAN通信差分电路等。使用Simulink对算法进行仿真验证,云台控制算法使用了串级PID控制,底盘通过HI220陀螺仪传感器结合模糊控制算法实现平衡及运动。最终制作出了实体机器人并对模糊控制算法进行了验证,与传统PID算法相比,基于模糊控制的平衡机器人在响应速度、鲁棒性、稳定性等方面均有一定的提升。相比于传统四轮机器人,制作的平衡机器人能够更好地通过狭小的空间,对环境的适应性更强。 相似文献
9.
针对两轮自平衡机器人在学习过程中主动性差的问题,受心理学内在动机理论启发,提出一种基于内在动机的智能机器人自主发育算法。该算法在强化学习的理论框架中,引入模拟人类好奇心的内在动机理论作为内部驱动力,与外部奖赏信号一起作用于整个学习过程。采用双层内部回归神经网络存储知识的学习与积累,使机器人逐步学会自主平衡技能。最后针对测量噪声污染对机器人平衡控制中两轮角速度的影响,进一步采用卡尔曼滤波方法进行补偿,以提高算法收敛速度,降低系统误差。仿真实验表明,该算法能够使两轮机器人通过与环境的交互获得认知,成功地学会运动平衡控制技能。 相似文献
10.
针对Internet多机器人系统中存在的操作指令延迟、工作效率低、协作能力差等问题,提出了多机器人神经元群网络控制模型。在学习过程中,来自不同功能区域的多类型神经元连接形成动态神经元群集,来描述各机器人的运动行为与外部条件、内部状态之间复杂的映射关系,通过对内部权值连接的评价选择,以实现最佳的多机器人运动行为协调。以互联网足球机器人系统为实验平台,给出了学习算法描述。仿真结果表明,己方机器人成功实现了配合射门的任务要求,所提模型和方法提高了多机器人的协作能力,并满足系统稳定性和实时性要求。 相似文献
11.
为了有效地解决双轮机器人平衡控制问题,改善学习时间过长的问题,使双轮机器人具有自学习能力;将机器学习中强化学习算法应用于双轮机器人上,利用内部回归神经网络构造性能评价函数,设计了一种新型控制算法;该算法是一种不需要预测和辨识模型,在模型未知及没有先验经验的条件下,通过自身神经网络的在线学习,以实现对双轮机器人的自学习平衡控制; Matlab仿真以及物理实验表明:该方法能在短时间内成功实现对双轮机器人的自学习平衡控制,且在性能上优于其它学习算法. 相似文献
12.
针对运动平衡控制问题,提出了一个基于操作条件反射原理的感觉运动系统认知模型,研究了小脑、基底核、大脑皮质以及其它神经器官工作的协同性,构建了感觉运动系统的认知模型.该认知模型主要由小脑和基底核以及大脑皮质组成,其中:小脑通过监督学习实现状态到行为的感觉运动神经映射;基底核利用行为预测评价结果对动作实施基于操作条件反射原理的概率式选择;而大脑皮质接收并发送有用信号给基底核与小脑,形成了感觉运动系统的闭环反馈回路.本文描述了基于操作条件反射原理的感觉运动系统认知模型的具体结构、功能与算法,并在两轮机器人上进行了仿真实验,再现了机器人类似人或动物的自主学习能力和运动平衡技能.结果表明,该模型具有较强的认知特性,使机器人能通过自主学习掌握运动平衡的控制技能. 相似文献
13.
14.
针对现有双足机器人智能控制算法存在的轨迹偏差大、效率低等问题,提出了一种基于D-DQN强化学习的控制算法;先分析双足机器人运动中的坐标变换关系和关节连杆补偿过程,然后基于Q值网络实现对复杂运动非线性过程降维处理,采用了Q值网络权值和辅助权值的双网络权值设计方式,进一步强化DQN网络性能,并以Tanh函数作为神经网络的激活函数,提升DQN网络的数值训练能力;在数据训练和交互中经验回放池发挥出关键的辅助作用,通过将奖励值输入到目标函数中,进一步提升对双足机器人的控制精度,最后通过虚拟约束控制的方式提高双足机器人运动中的稳定性;实验结果显示:在D-DQN强化学习的控制算法,机器人完成第一阶段测试的时间仅为115 s,综合轨迹偏差0.02 m,而且步态切换极限环测试的稳定性良好。 相似文献
15.
针对轮腿平衡机器人的整体控制问题展开研究,建立了机器人动力学模型,采用LQR(linear quadratic regulator)算法对解耦后的平衡与纵向运动子系统进行分析,并设计控制器。利用VMC(virtual model control)的思路,将倒立摆机器人中的力矩转换成轮腿结构中关节力矩。通过搭建仿真平台(Simulink Mulitibody)对控制器的性能进行仿真实验。设计相应控制器对机器人高度与横滚姿态等状态进行控制,并在实际机器人中进行验证整套控制器的性能,具有一定的理论价值和实际应用价值。 相似文献
16.
17.
《计算机测量与控制》2014,(4)
针对本质不稳定的轮式机器人运动平衡问题,基于操作条件反射原理,结合鲁棒控制,提出了一种鲁棒仿生自主学习算法作为轮式机器人的学习机制;该算法利用鲁棒控制可以提高系统抑制干扰的能力,产生最优控制行为的特点,将其与操作条件反射原理相结合,使机器人通过与未知环境的交互、学习和训练,模拟生物操作条件反射机制以及自学习和自适应技能,实现对轮式机器人的运动平衡控制,并从理论上证明了算法的稳定性;最后,分别用该算法在无干扰和有干扰的两种情况下对机器人做了仿真实验并进行了比较,结果表明,鲁棒仿生自主学习算法能够使机器人获得自主学习和平衡控制的技能,并体现出了较好的学习性能抗干扰能力。 相似文献
18.
19.
模糊Q学习的足球机器人双层协作模型 总被引:1,自引:0,他引:1
针对传统的足球机器人3层决策模型存在决策不连贯的问题和缺乏适应性与学习能力的缺点,提出了一种基于模糊Q学习的足球机器人双层协作模型.该模型使协调决策和机器人运动成为2个功能独立的层次,使群体意图到个体行为的过度变为一个直接的过程,并在协调层通过采用Q学习算法在线学习不同状态下的最优策略,增强了决策系统的适应性和学习能力.在Q学习中通过把状态繁多的系统状态映射为为数不多的模糊状态,大大减少了状态空间的大小,避免了传统Q学习在状态空间和动作空间较大的情况下收敛速度慢,甚至不能收敛的缺点,提高了Q学习算法的收敛速度.最后,通过在足球机器人SimuroSot仿真比赛平台上进行实验,验证了双层协作模型的有效性. 相似文献
20.
研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统$ Q $学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近$ Q $值函数,网络的输入为状态行动对,输出为该状态行动对的$ Q $值.给出RBF-$ Q $学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的$ Q $学习.针对不同的品种数情况进行仿真分析,仿真结果表明,RBF-$ Q $学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度. 相似文献