首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
未知环境下的多机器人合作是一个复杂的控制问题.它的解决方案要求在机器人内部任务目标与机器人之间的任务目标间保证有适当的均衡,而机器人间的协作是多机器人系统高效工作的关键.证明了一种分布式的结构自适应的组织模型在MAS中是鲁棒的和高效的.基于自组织的原则,在执行任务时机器人可以通过任务分配实时改变组织结构.各机器人之间通过任务分配的关系记录来确定下一步的关系.实验证明:此方法能接近到集中式控制方法的上界,优于静态的和随机的任务分配方法.  相似文献   

2.
基于强化学习的多机器人协作   总被引:3,自引:0,他引:3  
提出了一种动态环境下多个机器人获取合作行为的强化学习方法,该方法采用基于瞬时奖励的Q-学习完成单个机器人的学习,并利用人工势场法的思想确定不同机器人的学习顺序,在此基础上采用交替学习来完成多机器人的学习过程。试验结果表明所提方法的可行性和有效性。  相似文献   

3.
为了在连续和动态的环境中处理智能体不断变化的需求,我们通过利用强化学习来研究多机器人推箱子问题,得到了一种智能体可以不需要其它智能体任何信息的情况下完成协作任务的方法。强化学习可以应用于合作和非合作场合,对于存在噪声干扰和通讯困难的情况,强化学习具有其它人工智能方法不可比拟的优越性。  相似文献   

4.
针对多机器人协作复杂搜集任务中学习空间大,学习速度慢的问题,提出了带共享区的双层强化学习算法。该强化学习算法不仅能够实现低层状态-动作对的学习,而且能够实现高层条件-行为对的学习。高层条件-行为对的学习避免了学习空间的组合爆炸,共享区的应用强化了机器人间协作学习的能力。仿真实验结果说明所提方法加快了学习速度,满足了未知环境下多机器人复杂搜集任务的要求。  相似文献   

5.
自主微小型移动机器人的协作学习研究是多智能体机器人系统理论的主要研究方向。因为单个微小型移动机器人能力有限,所以机器人之间的协作在某些重要的基础工业和生物医学领域方面显得非常重要。该文介绍了几种用于协作学习的方法并且比较了它们之间的优点和缺点。最后,简要介绍了一些研究工作。  相似文献   

6.
基于多智能体的多机器人控制研究   总被引:1,自引:0,他引:1  
多机器人控制是目前机器人研究的关键问题,本文以足球机器人为研究平台,首先讨论多智能体系统的组织结构和智能体的体系结构;然后,基于多智能体理论,组建多机器人系统,提出一种适用性广泛的多机器人协作控制方案,主智能体和辅助智能体相互协作,降低多机器人系统控制的复杂度.提高了控制效率.实验结果证明该协作控制方案的优越性.  相似文献   

7.
多机器人协作导航目前广泛应用于搜索救援、物流等领域, 协作策略与目标导航是多机器人协作导航面临的主要挑战. 为提高多个移动机器人在未知环境下的协作导航能力, 本文提出了一种新的分层控制协作导航(hierarchical control cooperative navigation, HCCN) 策略, 利用高层目标决策层和低层目标导航层, 为每个机器人分配一个目标点, 并通过全局路径规划和局部路径规划算法, 引导智能体无碰撞地到达分配的目标点. 通过Gazebo平台进行实验验证, 结果表明, 文中所提方法能够有效解决协作导航过程中的稀疏奖励问题, 训练速度至少可提高16.6%, 在不同环境场景下具有更好的鲁棒性, 以期为进一步研究多机器人协作导航提供理论指导, 应用至更多的真实场景中.  相似文献   

8.
基于协作协进化的多智能体机器人协作研究   总被引:2,自引:0,他引:2  
协作问题一直是自主多智能体机器人系统研究的关键问题之一。基于多智能体机器人系统的CCP协作协议所生成的各智能体机器人的任务序列依赖于目标的初始顺序,因此难以得到最优解。文章提出了利用协作协进化来实现多智能体机器人之间协作的一种机制。该方法采用基于协作种群的技术来生成多智能体机器人任务执行序列,在给定的任务分解产生的所有可能解中寻找最优解,并通过交换局部知识和并行决策等手段来优化系统的性能。利用该机制,对3个智能体协作搬运8个物体进行计算机模拟,结果表明,该机制在优化任务执行序列方面作用明显,从而能有效提高多智能体机器人系统的性能。  相似文献   

9.
强化学习是提高机器人完成任务效率的有效方法,目前比较流行的学习方法一般采用累积折扣回报方法,但平均值回报在某些方面更适于多机器人协作。累积折扣回报方法在机器人动作层次上可以提高性能,但在多机器人任务层次上却不会得到很好的协作效果,而采用平均回报值的方法,就可以改变这种状态。本文把基于平均值回报的蒙特卡罗学习应用于多机器人合作中,得到很好的学习效果,实际机器人实验结果表明,采用平均值回报的方法优于累积折扣回报方法。  相似文献   

10.
运用多智能体系统的思想,提出了一种多智能体协作控制模型,通过对多智能体的规划提高了足球机器人系统决策系统的连贯性,系统利用改进的黑板结构有效地解决了角色分配及通信问题。通过实例分析了模型及其策略在系统协作控制方面的实用性。  相似文献   

11.
人工神经网络是对生物神经系统的模拟,它的信息处理功能与网络单元的特性密切相关。神经元的研究方兴未艾,神经元的效率问题有待提升。通过研究神经元学习算法,提高神经元的学习效率,并且提出一种新的神经元模型。  相似文献   

12.
基于量子计算的多Agent协作学习算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对多Agent协作强化学习中存在的行为和状态维数灾问题,以及行为选择上存在多个均衡解,为了收敛到最佳均衡解需要搜索策略空间和协调策略选择问题,提出了一种新颖的基于量子理论的多Agent协作学习算法。新算法借签了量子计算理论,将多Agent的行为和状态空间通过量子叠加态表示,利用量子纠缠态来协调策略选择,利用概率振幅表示行为选择概率,并用量子搜索算法来加速多Agent的学习。相应的仿真实验结果显示新算法的有效性。  相似文献   

13.
从宏观和微观论多智能体系统与足球机器人系统体系结构   总被引:4,自引:0,他引:4  
在半自主型的MAS组织结构的基础上,建立具有Agent、逻辑Agent与物理Agent的异构体系,从微观和宏观两种技术路线分析了多智能体系统 (MAS)的组织结构和Agent的体系结构,提出了一种足球机器人系统的分层知识、分层推理的体系结构模型,可简化推理过程,又增强推理能力,提高足球机器人的应变能力和实时性.  相似文献   

14.
通过"人—机—环境"耦合关系,对路况与时间变化关系进行研究。综合车辆运行过程中不同时段的路况差异和人因作用、突发道路事故随机性,以神经网络有师学习作为经验累积方法,提出时间递推预测方法确定路径最短时间,从而实现对交通路径的动态诱导。递推预测以知识库累积经验与实时路况信息作比较,为驾驶者提供实时有效的路况信息支撑。结果表明,该诱导技术可辅助驾驶者及时对路况作出正确判断,减少因经验不足和突发事件造成的时间损失,适用于安装有GPS导航的车辆。实例分析表明,所构建模型与实际数据结合收到良好效果。  相似文献   

15.
基于人工神经网络的葡萄病害诊断专家系统   总被引:2,自引:0,他引:2       下载免费PDF全文
设计了一种基于人工神经网络的葡萄病害诊断专家系统。以常见的18种主要的葡萄病害为研究对象,将专家知识转换为诊断规则,并作为学习样本输入神经网络进行训练,形成人工神经网络推理机。同时,采用知识库、规则推理和人工神经网络推理相结合的系统结构来优化专家系统,在提高专家系统自学能力的同时也提高了系统的响应速度。采用C#、Matlab和.NET技术混合编程实现专家系统,实验结果表明该系统有较高的诊断准确率并能稳定运行。该系统在Web上运行,更有利于系统的推广应用。  相似文献   

16.
针对多机器人系统中避碰问题,提出一种基于改进人工协调场的多机器人避碰算法。首先采用凸化障碍,子目标主动选择方法,解决人工协调场在有非凸障碍环境中的“死锁”问题;其次建立基于速度和距离的排斥力模型,以克服人工协调场对空间利用率低的缺陷,尤其是目标点与障碍物距离较近机器人无法抵达的情况;最后设计一种力混合器模型,并基于此模型以达到避免人工协调场中的运动抖动的效果。仿真实验证明该算法对解决有障碍环境下多机器人避碰问题的有效性和可靠性,增强了多机器人系统对复杂环境的适应性。  相似文献   

17.
郑云辉  郑伟  席宁  王越超 《计算机应用》2008,28(1):257-259,
设计并实现了基于Pocket PC的互联网遥操作机器人足球比赛系统,按照需求分析、系统设计与实现,以及实验结果的思路描述了整个过程,建立了无线网络环境下遥操作理论研究的实验平台,并以此为基础对遥操作机器人足球背景下的操作者策略与自主智能的融合作了一些探索。  相似文献   

18.
针对无线自组织网的不可信中继节点会带来严重安全威胁的问题,提出利用干扰节点保障通信的物理层安全机制。其信息传输分为两个阶段:中继节点获得来自发送端和干扰节点的含人工噪声的信号;目的接收端在干扰节点的协助消噪后还原出原始信息。由于中继节点和窃听者的接收信号始终伴随严重的噪声干扰,系统具有较高的安全性。仿真结果表明,窃听者和干扰节点在处于不同地理位置时,系统均具有较大的安全传输速率。  相似文献   

19.
张巍  滕少华  傅秀芬 《计算机应用》2009,29(1):284-287,
探讨并建立了一个基于多代理和数据融合技术的协同网络入侵检测模型,给出了协同网络入侵检测模型的体系结构及其组件,论述了从网络数据包中提取内容、网络连接与网络通信三种特征,生成可疑入侵事件,设计并实现了入侵事件检测代理(基于特征的检测代理和基于统计的检测代理),通过融合中心进一步改善了检测效果,实验结果表明了该模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号