共查询到17条相似文献,搜索用时 875 毫秒
1.
计算机博弈是一种对策性游戏,是人工智能的主要研究领域之一,它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计,将生成的博弈树节点的估值过程和对博弈树搜索过程相结合,采用传统的Alpha-Beta剪枝和极大-极小原则方法给出了博弈程序设计的核心内容:包括博弈树搜索和估值函数两个方面,提出了对原算法的一种改进,该算法提高了搜索速度。实验结果验证了算法的有效性。 相似文献
2.
博弈算法在黑白棋中的应用 总被引:1,自引:0,他引:1
计算机博弈是一种对策性游戏,是人工智能的主要研究领域之一.它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计,将生成的博弈树节点的估值过程和对博弈树搜索过程相结合,采用传统的Alpha—Beta剪枝和极大一极小原则方法给出了博弈程序设计的核心内容:包括博弈树搜索和估值函数两个方面,提出了对原算法的一种改进,该算法提高了搜索速度。实验结果验证了算法的有效性。 相似文献
3.
蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。 由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性和效率。 相似文献
4.
成三棋游戏是经典的"二人零和、全信息、非偶然"博弈。本文使用极大极小值搜索算法对博弈树进行搜索,并运用Alpha-Beta剪枝与迭代加深搜索进行优化。该游戏基于iPhone平台,将Cocos2d游戏框架设计应用于成三棋项目中。通过对成三棋游戏的研究与分析,在博弈算法方面进行了大量的设计与优化,游戏达到了较高的智能水平。 相似文献
5.
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。 相似文献
6.
博弈树搜索与静态估值函数 总被引:3,自引:0,他引:3
本文就中国象棋残局这种博弈树来讨论博弈树的搜索技术和静态估值函数的关系。首先提出一个负极大值搜索算法,然后根据静态估值函数来讨论搜索算法求解效率。 相似文献
7.
前向启发式搜索和放宽规划方法被很多领域无关的规划器所采用,被认为是一种有效的规划范型.FF规划器利用放宽规划图计算状态的启发式估值,并提取有利动作集合进行前向搜索的剪枝.但过大的有利动作集合造成了过多的消耗.文中提出了一种新的高质量的领域无关剪枝策略.该策略根据放宽规划图的动作层和命题层之间的关系,提取出所谓的直接效用动作集合,此集合之外的其它动作都被剪枝.直接效用动作集合比FF的有利动作集合更加精简,更具启发性,能指导前向搜索集中在那些离目标更近的状态.根据直接效用动作作者开发了一种新的lookahead搜索邻居,并应用在改进后的增强型爬山搜索算法中,使得前向搜索具备良好的前瞻性.当增强型爬山法失败时,采取一种从局部极小值重启完备搜索的策略以保持系统完备性.通过对国际规划大赛基准问题的测试表明,基于该剪枝策略及前向搜索算法实现的前向规划系统有效地缩小了搜索空间,搜索的节点数目比FF的有利动作策略明显要少,搜索效率有显著的提升. 相似文献
8.
博弈是启发式搜索的一个重要应用领域,博弈的过程可以用一棵博弈搜索树表示,通过对博弈树进行搜索求取问题的解,搜索策略常采用α-β剪枝技术。在深入研究α-β剪枝技术的基础上,提出在扩展未达到规定深度节点时,对扩展出的子节点按照估价函数大小顺序插入到搜索树中,从而在α-β剪枝过程中剪掉更多的分枝,提高搜索效率。 相似文献
9.
10.
11.
纪洪生 《数字社区&智能家居》2006,(11):99-100
以alpha—beta剪枝算法为研究对象,提出一种基于alpha—beta剪枝和概率剪枝因素相结合的概率剪枝算法.来解决博弈树搜索问题。利用概率剪枝算法,可减少博弈树搜索深度,从而加快搜索进程。 相似文献
12.
纪洪生 《数字社区&智能家居》2006,(32)
以alpha-beta剪枝算法为研究对象,提出一种基于alpha-beta剪枝和概率剪枝因素相结合的概率剪枝算法,来解决博弈树搜索问题。利用概率剪枝算法,可减少博弈树搜索深度,从而加快搜索进程。 相似文献
13.
14.
联邦学习系统中, 在资源受限的边缘端进行本地模型训练存在一定的挑战. 计算、存储、能耗等方面的限制时刻影响着模型规模及效果. 传统的联邦剪枝方法在联邦训练过程中对模型进行剪裁, 但仍存在无法根据模型所处环境自适应修剪以及移除一些重要参数导致模型性能下降的情况. 本文提出基于联邦强化学习的分布式模型剪枝方法以解决此问题. 首先, 将模型剪枝过程抽象化, 建立马尔可夫决策过程, 使用DQN算法构建通用强化剪枝模型, 动态调整剪枝率, 提高模型的泛化性能. 其次设计针对稀疏模型的聚合方法, 辅助强化泛化剪枝方法, 更好地优化模型结构, 降低模型的复杂度. 最后, 在多个公开数据集上将本方法与不同基线方法进行比较. 实验结果表明, 本文所提出的方法在保持模型效果的同时减少模型复杂度. 相似文献
15.
针对当前反无人系统无法有效压制无人机的问题,使用多种拦截装备构建一种新的反无人机方法.传统多目标优化算法无法解决动态的任务分配问题,对此,提出一种基于深度Q网络(DQN)的多类型拦截装备复合式反无人机任务分配模型. DQN模块对任务分配问题进行初期决策.为了提高算法收敛速度和学习效率,该方法未采用下一时刻的状态来预测Q值,而是采用当前时刻的状态来预测Q值,消除训练过程中Q值过估计的影响.之后采用进化算法对决策结果进行优化,输出多个拦截方案.以国内某机场跑道周围区域开阔地为防护对象,构建反无人机系统的任务分配仿真环境,仿真结果验证了所提出方法的有效性.同时,将DQN与Double DQN方法相比,所提出改进DQN算法训练的智能体表现更为精确,并且算法的收敛性和所求解的表现更为优异.所提出方法为反无人机问题提供了新的思路. 相似文献
16.
黄炜 《数字社区&智能家居》2011,(9)
决策树是归纳学习和数据挖掘的重要方法,该文对c4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于信息检索结果分类中,实现了检索结果的分层分类处理。 相似文献