期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杜秀全程家兴《微机发展》2007,17(1):216-218

计算机博弈是一种对策性游戏,是人工智能的主要研究领域之一,它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计,将生成的博弈树节点的估值过程和对博弈树搜索过程相结合,采用传统的Alpha-Beta剪枝和极大-极小原则方法给出了博弈程序设计的核心内容:包括博弈树搜索和估值函数两个方面,提出了对原算法的一种改进,该算法提高了搜索速度。实验结果验证了算法的有效性。相似文献

2.

博弈算法在黑白棋中的应用 总被引：1，自引：0，他引：1

杜秀全程家兴《计算机技术与发展》2007,17(1):216-218

计算机博弈是一种对策性游戏，是人工智能的主要研究领域之一．它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计，将生成的博弈树节点的估值过程和对博弈树搜索过程相结合，采用传统的Alpha—Beta剪枝和极大一极小原则方法给出了博弈程序设计的核心内容：包括博弈树搜索和估值函数两个方面，提出了对原算法的一种改进，该算法提高了搜索速度。实验结果验证了算法的有效性。相似文献

3.

双人博弈问题中的蒙特卡洛树搜索算法的改进

季辉丁泽军《计算机科学》2018,45(1):140-143

蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性和效率。相似文献

4.

基于iPhone平台的成三棋博弈算法研究与实现

沈健陈启安《福建电脑》2012,(1):106-107,79

成三棋游戏是经典的"二人零和、全信息、非偶然"博弈。本文使用极大极小值搜索算法对博弈树进行搜索,并运用Alpha-Beta剪枝与迭代加深搜索进行优化。该游戏基于iPhone平台,将Cocos2d游戏框架设计应用于成三棋项目中。通过对成三棋游戏的研究与分析,在博弈算法方面进行了大量的设计与优化,游戏达到了较高的智能水平。相似文献

5.

面向多智能体博弈的并行蒙特卡洛树搜索算法研究

管延霞刘逊韵刘运韬谢旻徐新海《计算机工程与科学》2022,44(12):2128-2133

蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。相似文献

6.

博弈树搜索与静态估值函数 总被引：3，自引：0，他引：3

肖齐英王正志《计算机应用研究》1997,14(4):74-76

本文就中国象棋残局这种博弈树来讨论博弈树的搜索技术和静态估值函数的关系。首先提出一个负极大值搜索算法，然后根据静态估值函数来讨论搜索算法求解效率。相似文献

7.

一种高质量的领域无关前向规划剪枝策略

梁瑞仕姜云飞边芮陈蔼祥《计算机学报》2012,35(8):1620-1633

前向启发式搜索和放宽规划方法被很多领域无关的规划器所采用,被认为是一种有效的规划范型.FF规划器利用放宽规划图计算状态的启发式估值,并提取有利动作集合进行前向搜索的剪枝.但过大的有利动作集合造成了过多的消耗.文中提出了一种新的高质量的领域无关剪枝策略.该策略根据放宽规划图的动作层和命题层之间的关系,提取出所谓的直接效用动作集合,此集合之外的其它动作都被剪枝.直接效用动作集合比FF的有利动作集合更加精简,更具启发性,能指导前向搜索集中在那些离目标更近的状态.根据直接效用动作作者开发了一种新的lookahead搜索邻居,并应用在改进后的增强型爬山搜索算法中,使得前向搜索具备良好的前瞻性.当增强型爬山法失败时,采取一种从局部极小值重启完备搜索的策略以保持系统完备性.通过对国际规划大赛基准问题的测试表明,基于该剪枝策略及前向搜索算法实现的前向规划系统有效地缩小了搜索空间,搜索的节点数目比FF的有利动作策略明显要少,搜索效率有显著的提升. 相似文献

8.

博弈树启发式搜索的α-β剪枝技术研究

张聪品刘春红徐久成《计算机工程与应用》2008,44(16):54-55

博弈是启发式搜索的一个重要应用领域,博弈的过程可以用一棵博弈搜索树表示,通过对博弈树进行搜索求取问题的解,搜索策略常采用α-β剪枝技术。在深入研究α-β剪枝技术的基础上,提出在扩展未达到规定深度节点时,对扩展出的子节点按照估价函数大小顺序插入到搜索树中,从而在α-β剪枝过程中剪掉更多的分枝,提高搜索效率。相似文献

9.

基于PVS算法的苏拉卡尔塔棋博弈系统设计与实现

张涛江业峰李博文《信息与电脑》2023,(19):46-48

文章旨在介绍基于主变量导向搜索（Principal Variation Search,PVS）算法的苏拉卡尔塔棋博弈系统的设计与实现。为了优化搜索策略,提高搜索效率和决策准确性,文章选用将Alpha-Beta剪枝和主要变例相结合的PVS搜索算法设计与实现苏拉卡尔塔棋博弈系统。在评估函数方面,综合考虑盘面价值、棋子价值、移动范围以及攻击范围等关键因素,从而准确评估当前棋局状态。本研究的贡献在于实现了一个苏拉卡尔塔棋博弈系统,并为该领域的未来研究奠定了坚实基础。相似文献

10.

五子棋机器博弈系统评估函数的设计

张明亮吴俊李凡长《计算机应用》2012,32(7):1969-1972

针对五子棋机器博弈需借助棋型评估棋局产生的速度瓶颈,提出了棋型识别粒度与搜索深度相关联的多层架构评估函数设计方法。实验证实粗颗粒度估值在深层搜索时整体效率更高;多层次判读棋型能明显加快评估速度;走法生成函数引入快速评估,提前进行博弈树自然剪枝收效显著;非关键棋型依据棋局浮动分值平衡搜索深度,对五子棋亦见成效;以及估值函数针对性地延伸评估来减少地平线效应的开销更少;从而表明估值函数动态评估更加合理。相似文献

11.

基于概率的剪枝算法

纪洪生《数字社区&智能家居》2006,(11):99-100

以alpha—beta剪枝算法为研究对象，提出一种基于alpha—beta剪枝和概率剪枝因素相结合的概率剪枝算法．来解决博弈树搜索问题。利用概率剪枝算法，可减少博弈树搜索深度，从而加快搜索进程。相似文献

12.

基于概率的剪枝算法

纪洪生《数字社区&智能家居》2006,(32)

以alpha-beta剪枝算法为研究对象,提出一种基于alpha-beta剪枝和概率剪枝因素相结合的概率剪枝算法,来解决博弈树搜索问题。利用概率剪枝算法,可减少博弈树搜索深度,从而加快搜索进程。相似文献

13.

结合先验知识与蒙特卡罗模拟的麻将博弈研究

下载免费PDF全文

王亚杰乔继林梁凯谢延延《智能系统学报》2022,17(1):69-78

针对内陆麻将缺乏统一平台和大量牌谱数据,难以设计出基于监督学习的博弈算法的问题,本文设计了一系列将规则、经验与蒙特卡罗方法相结合的博弈算法.首先,分别针对麻将博弈的弃牌模块、听牌模块、吃牌模块提出了弃牌优先级、听牌有效数、吃牌优先级的方法,完善了麻将AI的知识体系,设计了基础版博弈算法Fanfou_ba和优化版博弈算法... 相似文献

14.

基于联邦强化学习的分布式模型剪枝

聂宇铭臧文科马学豪刘宇儒包致成张镇彭亿《计算机系统应用》2024,33(5):154-161

联邦学习系统中, 在资源受限的边缘端进行本地模型训练存在一定的挑战. 计算、存储、能耗等方面的限制时刻影响着模型规模及效果. 传统的联邦剪枝方法在联邦训练过程中对模型进行剪裁, 但仍存在无法根据模型所处环境自适应修剪以及移除一些重要参数导致模型性能下降的情况. 本文提出基于联邦强化学习的分布式模型剪枝方法以解决此问题. 首先, 将模型剪枝过程抽象化, 建立马尔可夫决策过程, 使用DQN算法构建通用强化剪枝模型, 动态调整剪枝率, 提高模型的泛化性能. 其次设计针对稀疏模型的聚合方法, 辅助强化泛化剪枝方法, 更好地优化模型结构, 降低模型的复杂度. 最后, 在多个公开数据集上将本方法与不同基线方法进行比较. 实验结果表明, 本文所提出的方法在保持模型效果的同时减少模型复杂度. 相似文献

15.

基于DQN的多类型拦截装备复合式反无人机任务分配方法

黄亭飞程光权黄魁华黄金才刘忠《控制与决策》2022,37(1):142-150

针对当前反无人系统无法有效压制无人机的问题,使用多种拦截装备构建一种新的反无人机方法.传统多目标优化算法无法解决动态的任务分配问题,对此,提出一种基于深度Q网络(DQN)的多类型拦截装备复合式反无人机任务分配模型. DQN模块对任务分配问题进行初期决策.为了提高算法收敛速度和学习效率,该方法未采用下一时刻的状态来预测Q值,而是采用当前时刻的状态来预测Q值,消除训练过程中Q值过估计的影响.之后采用进化算法对决策结果进行优化,输出多个拦截方案.以国内某机场跑道周围区域开阔地为防护对象,构建反无人机系统的任务分配仿真环境,仿真结果验证了所提出方法的有效性.同时,将DQN与Double DQN方法相比,所提出改进DQN算法训练的智能体表现更为精确,并且算法的收敛性和所求解的表现更为优异.所提出方法为反无人机问题提供了新的思路. 相似文献

16.

C4.5算法在信息检索结果分类中的应用

黄炜《数字社区&智能家居》2011,(9)

决策树是归纳学习和数据挖掘的重要方法,该文对c4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于信息检索结果分类中,实现了检索结果的分层分类处理。相似文献

17.

一种军棋机器博弈的多棋子协同博弈方法

下载免费PDF全文

张小川王宛宛彭丽蓉《智能系统学报》2020,15(2):399-404

针对在军棋博弈不完全信息对弈中，面对棋子不同价值、不同位置、不同搭配所产生的不同棋力，传统的单子意图搜索算法，不能满足棋子之间的协同性与沟通性，同时也缺乏对敌方的引诱与欺骗等高级对抗能力。本文提出一种结合UCT搜索策略的高价值棋子博弈方法，实现高价值棋子协同博弈的策略。实战经验表明:高价值多棋子军棋协同博弈策略优于单棋子军棋博弈策略。相似文献