首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
在RoboCup足球2D仿真比赛中,智能体的主要行为有传球、带球、射门、截球等等。而传球策略在其中起着至关重要的作用,它牵涉到多智能体的协作问题。本文中提出的基于速度选择的RoboCup传球策略大大地提高了传球的成功率和准确率,节省了球员体力。  相似文献   

2.
Q学习算法在RoboCup带球中的应用   总被引:1,自引:0,他引:1  
机器人世界杯足球锦标赛(RoboCup)是全球影响力最大的机器人足球比赛之一,而仿真组比赛是其重要的组成部分。鉴于带球技术在仿真组比赛中的重要性,我们将Q学习算法应用于带球技术训练中,使智能体本身具有学习和适应能力,能够自己从环境中获取知识。本文描述了应用Q学习算法在特定场景中进行1vs.1带球技术训练的方法和实验过程,并将训练方法应用于实际球队的训练之中进行了验证。  相似文献   

3.
智能体对环境的认识是其进行决策的重要依据。在机器人足球仿真比赛(RoboCup)中,视觉感知是智能体获得信息、构建世界模型的主要途径。针对仿真比赛中球员智能体进行决策时信息不准确的问题,结合优先级和可信值对智能体的视觉策略进行了设计。根据对观察目标需求的紧迫程度动态地指定观察目标的优先级,然后结合世界模型维护的观察目标的可信值生成各个视觉角度的评价值,通过搜索评价值最大的视觉角度获得优化的视觉信息。实验结果表明这种视觉策略使球员动作的执行更加可靠,增强了球队的整体性能。  相似文献   

4.
多配送中心车辆路径规划(multi-depot vehicle routing problem, MDVRP)是现阶段供应链应用较为广泛的问题模型,现有算法多采用启发式方法,其求解速度慢且无法保证解的质量,因此研究快速且有效的求解算法具有重要的学术意义和应用价值.以最小化总车辆路径距离为目标,提出一种基于多智能体深度强化学习的求解模型.首先,定义多配送中心车辆路径问题的多智能体强化学习形式,包括状态、动作、回报以及状态转移函数,使模型能够利用多智能体强化学习训练;然后通过对MDVRP的节点邻居及遮掩机制的定义,基于注意力机制设计由多个智能体网络构成的策略网络模型,并利用策略梯度算法进行训练以获得能够快速求解的模型;接着,利用2-opt局部搜索策略和采样搜索策略改进解的质量;最后,通过对不同规模问题仿真实验以及与其他算法进行对比,验证所提出的多智能体深度强化学习模型及其与搜索策略的结合能够快速获得高质量的解.  相似文献   

5.
介绍基于目标型的智能体,通过Mathematica强大的演算、作图功能,实现不同的搜索策略,并依据实验分析推导各个算法的特性。在通用算法的基础上,结合新的搜索思想加以改进,提出了基于目标的双向搜索策略,并验证该策略在智能车辆路径搜索中的完备性和最优性。  相似文献   

6.
针对智能仓储环境下多载位自主移动机器人集群拣选-配送路径规划问题,提出一种改进型基于冲突搜索的多智能体路径规划算法.在模型方面,采用多载位机器人替代KIVA机器人,建立以最小化拣选-配送时间以及无效路径比为目标的数学规划模型.在算法方面,首先,提出一种基于优先级规则的多智能体冲突消解加速策略;然后,设计基于动态规划的单机器人拣选序列优化算法;最后,设计考虑转向惩罚的增强A*算法搜索机器人最优路径.实验结果表明:所提出模型与KIVA系统相比有较大优越性;所提出算法能够有效缩短拣选-配送时间、减少无效路径时间.  相似文献   

7.
救援仿真中,警察清理阻塞道路的效果在整个灾难救援中有着至关重要的作用。本文针对警察智能体如何清理道路,提出一种基于效用函数实现警察智能体的任务分配方法以及一种基于A*算法的路径搜索方法。通过仿真实验和比赛验证了该控制方法在救援仿真系统的有效性。  相似文献   

8.
针对量子进化计算中反馈信息利用不充分并容易早熟的不足,将量子进化计算与及蚂蚁寻优策略融合,提出了一种新的优化方法—混合量子进化算法(HQEA).以量子染色体表示智能蚂蚁所有可能的搜索路径,初始阶段采用量子进化学习,设计了智能蚂蚁网络及衔接算子,进化学习所得结果表示智能蚂蚁路径选择的概率,并利用蚁群寻优策略继续搜索求精确解.理论证明该算法具有全局收敛性.最后以背包问题对算法进行了测试.  相似文献   

9.
多智能体路径规划是一类寻找多个智能体从起始位置到目标位置且无冲突的最优路径集合的问题,针对该问题的研究在物流、军事和安防等领域有着大量的应用场景.对国内外关于多智能体路径规划问题的研究进展进行系统整理和分类,按照结果最优性的不同,多智能体路径规划算法被分为最优算法和近似算法2类.最优的多智能体路径规划算法主要分为基于A*搜索、基于代价增长树、基于冲突搜索和基于规约的4种算法.近似的多智能体路径规划算法主要分为无边界次优的算法和有边界次优的算法2类.基于上述分类,分析各种算法的特点,介绍近年来具有代表性的研究成果,并对多智能体路径规划问题未来的研究方向进行展望.  相似文献   

10.
多智能体路径规划是人工智能领域一个经典的搜索问题,基于冲突的搜索算法是当前解决该问题的最优算法之一。文中讨论了多智能体路径规划的基础研究,对国内外近年来基于冲突搜索算法及其变体的研究成果进行了分类,根据改进方式将其变体分为4类,包括分割策略的改进、启发式算法、对典型冲突的处理和次优算法。同时介绍了基于冲突的搜索算法在多智能体路径规划的扩展问题中的应用。最后根据当前算法的优缺点,指出了目前面临的挑战,并针对这些挑战给出了未来可能的研究方向。  相似文献   

11.
将记忆机制引入传统蚁群算法,把蚂蚁看作具有记忆的智能体,通过对记忆的存储、更新及遗忘原理进行分析,建立一种基于生物记忆原理的蚁群智能体记忆模型。在模型中,蚂蚁智能体能够凭借记忆对自身记忆库和蚁群记忆库进行不断搜索和更新,及时调整当前最优路径。记忆原理与传统蚁群算法的结合替代了后者多次反复迭代的寻优模式,能更好地实现路径选优、缩短搜索时间、提高算法执行效率。实践检验发现,该模型能实时追踪蚁群智能体的最新动态,对当前最优路径做出及时调整和判断,从而引导自身及其他蚂蚁智能体准确、高效地寻找到最优路径。  相似文献   

12.
研究足球机器人供过传球的成功率,优化控制策略,在机器人足球比赛中,针对现有行为选择策略因不能综合全面地考虑场上复杂的影响因素,造成传球、带球和射门的失误率较高的问题。为提高球员带球的准确率,提出了一种模糊Q学习的行为选择决策机制。利用模糊算法全面地处理和评估场上的干扰和影响因素,做出最佳行为决策。并通过Q学习算法来修正模糊规则。采用上述算法的行为选择策略,增强了策略对动态环境的适应能力。在机器人足球世界杯2D仿真平台上对策略进行了仿真验证,仿真结果表明改进算法能够很好的改善智能体的射门、传球和带球的成功率。  相似文献   

13.
通过引入人类足球比赛中的战术思想,对半自主足球机器人系统的攻防策略进行了详细分析和深入研究.提出了在危险区域盯人防守的概念,并详细介绍了该防守角色的具体设计和实现.对于进攻中基于对方信息的避障方法进行了研究,通过对比赛中多种情况的具体分析,重点针对无球避障和带球避障建立了数学模型,根据不同的回避方式分别规划机器人队员的进攻路径,在实际系统中的应用取得了良好效果.  相似文献   

14.
面向未知战场环境的路径规划问题,提出一种多层双向A~*算法。该算法引入分层策略,使智能体在行进过程中实时响应突发障碍,进行有效避障路径重规划。采用同步双向搜索,并改进启发式代价函数,使得路径搜索算法快速收敛,提高算法在大规模环境中的路径规划效率。为保证智能体在拐角的行进安全,使用Hermite差值对路径进行平滑处理。实验表明,该算法与现有改进算法相比,处理冗余节点数减少12.9%,总用时缩短17.4%,在复杂未知环境中路径规划准确度和效率均有较大提高。  相似文献   

15.
针对传统海上搜索研究中搜索平台与行为单一、缺乏协同的问题,建立多平台海上协同搜索路径优化模型,研究协同搜索与路径优化对策.在协同搜索策略方面,给出同构协同与异构协同搜索策略的定义,并设计不同规模的协同仿真场景;在路径优化策略方面,根据海上搜索平台的搜索特点,设计基于行为和基于智能算法的路径优化策略.在此基础上,对比研究不同规模的海上协同搜索策略与路径优化策略效果.结果表明:基于混合智能算法的路径优化效果普遍优于基于行为的搜索策略与单一算法,异构协同搜索策略能够充分发挥各平台优势、取长补短,取得了优于单平台和同构协同搜索的收益效果.  相似文献   

16.
本文提出了一种基于强化学习的足球机器人带球任务的解决方案,带球方从阶段的开始到结束均尽力去控制足球,对方的队员则尽力从控球方抢夺足球。在本论文中控球方采用SARSA控制算法,防守方采用传统的策略。将这两种策略应用于4V3机器人比赛环境中,实验结果显示,经过多次的学习,在机器人的带球时间上取得了理想的效果。  相似文献   

17.
基于层次空间推理模型的交通网络最优路径算法   总被引:4,自引:0,他引:4       下载免费PDF全文
李建元  师军 《计算机工程》2006,32(20):207-209
在交通地理信息系统(GIS-T)和智能交通系统(ITS)中,单源最短路径问题是一个研究热点。该文总结了已有的层次空间推理过程,针对交通网络,运用了限制搜索区域策略和比较策略,提出了新的层次空间推理过程,寻找更为可靠的入口,以便搜索到更可靠的最优路径,保证层内最优路径搜索的高效率,进一步提高了最优路径算法的可靠性,并对算法的效率进行了必要的分析。  相似文献   

18.
综合多智能体的局部感知能力和遗传算法的强搜索能力,提出了一种混合多智能体遗传算法(HMAGA)。该方法构造了启发式搜索和混合交叉策略完成智能体之间的竞争和合作,综合凸变异和局部搜索体现智能体的自学习特性,通过智能体之间的相互作用来达到信息扩散的目的,最终收敛到全局最优解。在多组不同类型函数上的仿真实验结果表明,该算法具有良好的性能,特别是对于复杂的合成函数。  相似文献   

19.
在RoboCup仿真比赛中,每一个球员都是一个智能体,而球队的强与弱很大程度上体现了球员智能体技能动作设计的优与劣。高层的战术策略可以分解成一系列的技能动作,球队11个智能体之间的合作与协调也是通过调用一些基本的技能动作来实现的。介绍了球员智能体一些技能动作的设计方法和设计思路,在线调试中这些基本技能能够完成预期的动作,并具有很好的实时性。  相似文献   

20.
鉴于A*算法全局路径搜索的高效性与人工势场算法局部路径搜索的灵活性,通过一定的机制把两者结合起来,在部分环境信息已知的情况下,把路径规划分为趋向于目标的全局路径规划和躲避未知障碍或其它移动智能体的局部路径规划两个部分,将基于反应的行为规划和基于慎思的行为规划相结合,并通过环境建模、算法设计,实验仿真验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号