首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
针对智能体的行为认知问题,提出一种小脑与基底神经节相互协调的行为认知计算模型。该模型核心为操作条件学习算法,包括评价机制、行为选择机制、取向机制及小脑与基底神经节的协调机制。初期的学习信号来自于下橄榄体和黑质两部分,在熵的意义上说明该算法是收敛的。采用该学习方法为自平衡两轮机器人建立运动神经认知系统,利用RBF网络逼近行为和评价网络。仿真实验表明该方法改善仅有基底神经节作用的行为-评价算法学习速度慢和失败次数多的问题,学习后期通过温度的不断降低,加快学习速度,震荡逐渐消失,改善学习效果。  相似文献   

2.
阮晓钢  张家辉  黄静  柴洁  武悦 《控制与决策》2021,36(9):2211-2217
为了探讨动机在环境认知中所起作用,模仿生物环境认知行为,以学习自动机为框架,提出一种结合内在动机理论的移动机器人环境认知模型(CM-LA).该模型以访问次数及访问时间间隔共同定义内在动机,并以操作条件反射原理描述外在动机的影响.同时,所设计的动作选择机制可以使机器人根据已有的环境认知对新增障碍物进行有效避让.实验结果表...  相似文献   

3.
针对两轮机器人运动平衡控制问题,为其建立起一种人工感知运动系统TWR-SMS(Two-wheeled robot sensorimotor system),使机器人在与环境的接触过程中可以通过学习自主掌握运动平衡技能.感知运动系统的认知系统以学习自动机为数学模型,引入好奇心和取向性概念,设计了能够主动探索环境以及主动学习环境的内发动机机制.实验结果证明内发动机机制的引入不仅提高了机器人的自学习和自组织特性,同时能够有效避免小概率事件的发生,稳定性较高.与传统线性二次型调节器(Linear quadratic regulator,LQR)控制方法的对比实验表明系统具有更好的鲁棒性.  相似文献   

4.
张晓平  李凯  王力  闫佳庆  何忠贺 《控制与决策》2023,38(10):2850-2858
情感作为人类的高级认知,在环境学习和环境理解方面具有重要意义.将情感引入机器人搜索任务,同时结合记忆机理,提出一种具有情感和记忆机制的认知模型,由内部状态、感受器、环境状态系统、情感系统、动态知识库、行为决策系统以及执行器7部分组成.情感系统包含情感生成、情感状态以及情感记忆3个模块,其中,情感记忆用于提供内部奖励.记忆功能在动态知识库中实现.基于强化学习理论框架,将情感内部奖励与记忆进行融合,形成新的奖励机制,并设计相关认知学习算法.以需要“能量补给”的迷宫机器人搜索任务对所提出认知模型进行验证,结果发现,当面对不同情境时,机器人会产生不同的情感.结合前期记忆,机器人所作决策更“拟人”,表明情感和记忆机制设计的有效性.将所提出认知模型、无情感决策认知模型、基于ε-greedy策略的Q学习算法进行对比,结果表明,情感和记忆的引入,能够提高机器人的学习效率,同时学习过程更稳定.  相似文献   

5.
Skinner 操作条件反射的一种仿生学习算法与机器人控制   总被引:1,自引:0,他引:1  
针对两轮自平衡机器人的运动平衡控制问题,提出了基于Skinner 操作条件反射理论的BP 神经网络 与资格迹相结合的仿生自主学习算法作为两轮机器人的学习机制.该算法利用资格迹能解决延迟影响、加快学习速 度和提高可靠性的特点,将其与BP 神经网络相结合构成复合学习算法,能够预测机器人将要获得的行为评价函数, 并依据概率取向机制以一定的概率选择最大评价值对应的最优行为,从而使机器人能够在未知环境下通过与环境的 交互、学习和训练,获得像人或动物一样的自主学习技能,实现对两轮机器人的运动平衡控制.最后,分别用基于 Skinner 操作条件反射理论的BP 算法和BP 资格迹复合算法对两轮机器人做了仿真实验并进行了比较.结果表明, 基于Skinner 操作条件反射理论的BP 资格迹复合仿生自主学习算法的学习机制能够使机器人获得良好的动态性能 和较快的学习速度,体现了机器人较强的自主学习技能和平衡控制能力.  相似文献   

6.
戴丽珍  杨刚  阮晓钢 《自动化学报》2014,40(9):1951-1957
以两轮机器人的自主平衡学习控制为研究对象,针对传统控制方法无法实现机器人类似人或动物的渐进学习过程,依据斯金纳的操作条件反射理论建立了一种自治操作条件反射自动机(Autonomous operant conditioning automaton,AOCA)模型,设计一种基于AOCA的仿生学习算法,并进行机器人姿态平衡学习实验仿真研究. 实验结果表明,基于AOCA的仿生学习方法能有效地实现机器人的自主平衡学习控制,机器人系统的平衡能力在学习控制过程中自组织地渐进形成,并得以发展和完善.  相似文献   

7.
刘洋  季薇 《计算机应用》2013,33(5):1244-1247
针对同时使用硬合并和软合并的两步协作频谱感知方法在第二步的软融合时仍需向融合中心发送大量不必要数据的问题,引入了接收信噪比估计,提出了一种改进的两步协作感知算法。改进算法在低信噪比情况下使用传统的两步协作检测提升检测性能,在较高信噪比情况下则采用硬融合策略来减少发往融合中心的信息量。仿真结果表明,改进算法和传统的两步协作检测算法相比,能在几乎不损失检测性能的情况下,显著减少不必要的数据传送。  相似文献   

8.
为了在主用户具有异构性且认知用户处于多路径衰减、阴影效应等低感知性能的认知环境中,使认知用户公平有效地进行频谱感知,提出一种联盟博弈频谱感知机制,将频谱感知问题建模为效用不可转移的联盟博弈。首先,将认知用户划分成多个子联盟,根据头结点选取原则选出各个子联盟的头结点;其次,根据规则进行子联盟合并或分裂;最后,子联盟头结点利用“OR”规则进行数据融合,得到最终感知结果并广播给子联盟内的所有认知用户。仿真实现和性能评价结果表明,该机制具有好的性能。  相似文献   

9.
频谱感知的目标是在尽量避免对主用户造成干扰的条件下为感知用户提供尽可能多的频谱接入机会。由于单用户频谱检测算法的局限性,协作频谱感知被提了出来。在满足对主用户干扰限度的条件下,为了使单个授权信道的频谱感知效率达到最大,引入一种新的协作频谱感知机制,联合优化包括感知时间、传输时间、参与协作的感知用户数目在内的感知参数,并通过穷尽搜索算法得到最优解。在此基础上研究了多个授权信道情况下的频谱感知效率问题,提出了一种授权信道选择分配方案。仿真结果验证了所提方法的有效性。  相似文献   

10.
为了提高认知无线电系统中频谱感知的性能,对多维联合的频谱感知进行了研究,提出一种时域—码域联合的频谱感知算法。该算法主要利用了直接序列扩频主用户信号频谱空间中时域与码域的特性,分别从时域与码域的角度对信道的状态进行检测,其中时域采用能量感知,码域分析扩频主用户信号的二次功率谱,最终共同确认信道状态。仿真结果表明,联合感知算法对应的检测性能优于单纯时域或码域感知,能够直接应用于直接序列扩频主用户的频谱感知。  相似文献   

11.
郝水侠  李凡长 《计算机工程》2005,31(17):160-162
agent认知模型是多agent系统研究的基础。该文抓住多agent系统的社会行为特性,构建了动态的多agent系统模型。它可以动态地调整系统agent的个数,增强系统的求解问题的能力,整个系统随着问题求解的增多更加稳定。并且在构建动态多agent系统的基础上给出了多agent系统并行认知模型及其相关概念,并把该模型应用于问题求解。  相似文献   

12.
任红格  史涛  张瑞成 《机器人》2012,34(3):292-298
针对运动平衡控制问题,提出了一个基于操作条件反射原理的感觉运动系统认知模型,研究了小脑、基底核、大脑皮质以及其它神经器官工作的协同性,构建了感觉运动系统的认知模型.该认知模型主要由小脑和基底核以及大脑皮质组成,其中:小脑通过监督学习实现状态到行为的感觉运动神经映射;基底核利用行为预测评价结果对动作实施基于操作条件反射原理的概率式选择;而大脑皮质接收并发送有用信号给基底核与小脑,形成了感觉运动系统的闭环反馈回路.本文描述了基于操作条件反射原理的感觉运动系统认知模型的具体结构、功能与算法,并在两轮机器人上进行了仿真实验,再现了机器人类似人或动物的自主学习能力和运动平衡技能.结果表明,该模型具有较强的认知特性,使机器人能通过自主学习掌握运动平衡的控制技能.  相似文献   

13.
为探索认知机理、模拟认知机能进而提高机器人的认知及智能水平,提出了一种具有操作条件反射机能的人工感觉运动系统.该系统以复现感觉运动系统的方式重现了生物的运动神经认知,实现了从感知到运动的映射关系,同时借鉴了斯金纳的操作条件反射理论,使得该系统具有操作条件反射机能,遵从"刺激-反应-强化"的逻辑形成了感知与运动之间的闭环系统.为验证系统的正确有效性,复现了行为心理学及《控制论》中的两个经典实验.对比实验结果证明,本系统成功地模拟了生物感觉运动系统,使机器人具有类似生物的自学习能力,能自主的认知环境,实现对环境的自适应.  相似文献   

14.
针对基础矩阵的估计问题,提出一种基于Skinner概率自动机的抽样一致性算法(Skinner-Ransac)。该算法对数据样本集合中的每个样本赋予权值,并根据当前的抽样结果对每一个样本的权值进行更新;同时,针对先验知识缺乏的情况提出了3种迭代终止条件。以一组模拟数据和一组真实图像作为实验对象,与4个现有算法进行对比的实验结果表明, Skinner-Ransac无论在迭代次数,还是在计算精度上均优于其他算法。  相似文献   

15.

以学习自动机为数学模型, 结合斯金纳操作条件反射, 建立一种人工感知运动系统, 称为感知运动自动机(SMA). 该系统包括感知状态集合、动作集合、感知运动取向性映射集合等9 部分. 系统引入好奇心和取向性概念, 设计具有主动学习环境的内发动机机制, 定义并分析了取向性学习过程, 证明了系统熵的收敛性. 通过模拟斯金纳鸽子实验表明了系统的可行性和有效性, 仿真结果表明系统具有较好的自学习和自组织特性, 同时稳定性较高.

  相似文献   

16.
This paper introduces the integrated system of a smart-device-based cognitive robot partner called iPhonoid-C. Interaction with a robot partner requires many elements, including verbal communication, nonverbal communication, and embodiment as well. A robot partner should be able to understand human sentences, as well as nonverbal information such as human gestures. In the proposed system, the robot has an emotional model connecting the input information from the human with the robot’s behavior. Since emotions are involved in human natural communication, and emotion has a significant impact on humans’ actions, it is important to develop an emotional model for the robot partner to enhance human robot interaction. In our proposed system, human sentences and gestures influence the robot’s emotional state, and then the robot will perform gestural and facial expressions and generate sentences according to its emotional state. The proposed cognitive method is validated using a real robot partner.  相似文献   

17.
针对双足机器人最简模型在行走过程中出现摆动腿足部擦地的问题,提出了一种通过摆动腿膝关节弯曲达到摆动腿缩短的新模型。当摆动腿开始摆动时,摆动腿膝关节弯曲锁定,摆动腿缩短;当摆动腿摆动到最大位置时,膝关节解锁,摆动腿伸直再锁定,此后摆动腿回摆,系统变为直腿模型。采用脚后跟冲击控制,在摆动腿落地前,拖后的支撑腿与地面接触处施加一指向髋关节的瞬时冲击力,冲击力可以减小摆动腿着地时能量的损耗,同时驱动被动机器人向前行走。设计了迭代学习控制算法,找到极限环与不动点,实现不同给定期望步长跟踪的冲击力的计算。仿真结果表明,迭代学习控制可以有效的实现不同期望步长的跟踪,可以很快的找到机器人系统的不动点,通过收敛的相平面,得到稳定的极限环,保证了机器人行走过程稳定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号