排序方式: 共有26条查询结果,搜索用时 15 毫秒
1.
目前的步态优化算法仅仅实现了对单一目标的优化,把双足机器人步态优化看做是多目标优化问题,构建了衡量稳定性、能量消耗、步行速度三个目标评价函数。考虑到直接对多个目标加权求和的方法不能很好地处理多目标问题,提出一种新的基于约束满足的多目标步态参数优化算法,其思想是把基于惩罚函数的SPEA2(strength Pareto evolutionary algorithm2 )应用到多目标双足机器人动态步态参数优化问题上,规划出了同时满足这三个目标的动态优化步态。通过仿真实验表明了算法的有效性。 相似文献
2.
本文针对具体的双足机器人模型,对机器人进行逆运动学的建模,给出零力矩点(ZMP)计算的具体过程,利用零力矩点为运动中机器人的平衡问题提供很好的解决方案:在仿真平台下,在线计算运动中机器人的ZMP点,并通过分析ZMP的变化,评估动作的稳定性。 相似文献
3.
多agent系统的一个关键性的问题就是多agent之间的协作,即一组agent需要选择出一个联合动作,使得整体效用最大化。该文提出了基于值规则的协作图,并改进了变量消减算法,使用它们可以实现多agent在通信条件受到限制的离散状态空间里进行动作选择。 相似文献
4.
强化学习当前越来越多地应用于多智能体系统。在强化学习中,奖励信号起引导智能体学习的作用,然而多智能体系统任务复杂,可能只在任务结束时才能获得环境的反馈,导致奖励稀疏,大幅降底算法的收敛速度和效率。为解决稀疏奖励问题,提出一种基于理性好奇心的多智能体强化学习方法。受内在动机理论的启发,将好奇心思想扩展到多智能体中,并给出理性好奇心奖励机制,利用分解求和的网络结构将不同排列的联合状态编码到同一特征表示,减少联合状态的探索空间,将网络的预测误差作为内在奖励,引导智能体去研究新颖且有用的效用状态。在此基础上,引入双值函数网络对Q值进行评估,采用最小化算子计算目标值,缓解Q值的过估计偏差和方差,并采用均值优化策略提高样本利用。在追捕任务和合作导航任务的环境中进行实验评估,结果表明,在最困难的追捕任务中,该方法相较于基线算法,胜率提高15%左右,所需时间步降低20%左右,在合作导航任务中也具有较快的收敛速度。 相似文献
5.
多机器人系统(Multi Robot System,MRS)通过引入机器人个体情感因素,可以有效提高个体的自主协作能力、决策能力以及多机器人系统的整体智能化水平。然而,以往研究主要集中于个体情感状态(情绪、个性等),缺乏从团队情感层面来探索积极团队情感基调(Positive Group Affective Tone,PGAT)对团队协作能力和团队有效性的影响。为了发挥PGAT在任务分配中的积极作用,降低因为团队成员情绪衰减而导致团队解散的风险,并增加团队协作能力和团队有效性,提出了基于PGAT的情感机器人协作任务分配拍卖算法。仿真追捕对比实验表明,相对于基于焦虑情感模型的改进合同网协议多机器人任务分配算法和基于自主意识的分布式情感机器人任务分配算法,基于PGAT的情感机器人协作任务分配拍卖算法的追捕成功率分别提高了269.3%和6.5%,任务分配成功率分别提高了138.7%和5.1%,平均追捕时间分别缩短了14.5%和26.3%,并且在150场追捕对比实验中,追捕时间小于对比算法的场次占比分别达到87.3%和90.7%。 相似文献
6.
在强化学习中,当处于奖励分布稀疏的环境时,由于无法获得有效经验,智能体收敛速度和效率都会大幅下降.针对此类稀疏奖励,文中提出基于情感的异构多智能体强化学习方法.首先,建立基于个性的智能体情感模型,为异构多智能体提供激励机制,作为外部奖励的有效补充.然后,基于上述激励机制,融合深度确定性策略,提出稀疏奖励下基于内在情感激励机制的深度确定性策略梯度强化学习算法,加快智能体的收敛速度.最后,在多机器人追捕仿真实验平台上,构建不同难度等级的稀疏奖励情景,验证文中方法在追捕成功率和收敛速度上的有效性和优越性. 相似文献
7.
目标检测提取的特征信息不足,导致识别小目标或被遮挡目标时精确度不高.因此,文中提出多层上下文卷积网络(MLC-CNN),通过提取多层上下文信息特征并结合物体特征进行目标检测.MLC-CNN由区域生成网络(RPN)和多层上下文信息(MLC)两个子网络组成,RPN获取固定长度的特征向量作为目标特征,MLC获取不同层特征图上对应的上下文信息特征,最后融合两部分特征.此外,为了解决数据不均衡问题,融入难负样本训练.在PASCAL VOC2007和PASCAL VOC2012数据集上的实验表明,MLC-CNN的均值平均精度(mAP)具有明显提高. 相似文献
9.
机器人情感建模是研究情感机器人的热点问题。文中以情感心理学知识为基础,模拟具有不同个性的情感机器人在外界刺激作用下情感动态变化的过程,研究个性和外界刺激对情感转移过程的影响。采用基于状态空间的情感空间模型来描述机器人的情感状态,并用HMM过程来模拟情感状态的转移过程。但HMM过程只能求得当前情感状态的概率,为得到具体的情感状态,文中提出一种基于状态空间与概率空间映射的极大相似度匹配的情感转移模型。首先利用HMM过程计算出当前情感概率,然后通过极大相似度匹配来得到转移后具体的情感状态。通过调节模型参数来模拟不同个性和外界刺激,该模型能有效模拟情感状态变化过程。实验结果验证模型模拟的情感变化过程符合人类情感变化的一般规律。 相似文献
10.