首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 718 毫秒
1.
季辉  丁泽军 《计算机科学》2018,45(1):140-143
蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。 由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性和效率。  相似文献   

2.
计算机博弈的核心技术是搜索。本文针对单核条件下的搜索算法、并行条件下的搜索算法两个方面进行了研究。单核搜索算法方面,简单地介绍了博弈单核条件下的选择性搜索思想,本文研究了几种已有的多核条件下博弈并行搜索方法,分析了其优劣,并针对性地提出了改进方案,给出了系统实践的结果,比较了改进方法与原有方法的效果差异。最后,本文探讨了Alpha-Beta并行搜索系统实现中一些特殊的程序设计技巧。  相似文献   

3.
博弈树搜索的算法改进   总被引:2,自引:1,他引:2  
王镌 《福建电脑》2004,(2):26-27
在计算机博弈程序中,通常采用是α-β剪枝算法,为了进一步提高搜索速度,先后又出现了一些改进的算法。本文综合介绍了这些搜索算法的基本思想,并用伪语言对其算法进行了描述。  相似文献   

4.
围棋机器博弈是机器博弈中重要的分支之一,其庞大的博弈空间给机器博弈研究者带来了巨大挑战.目前围棋机器博弈多采用静态估值搜索与蒙特卡洛树搜索,故将时间差分算法引入至九路围棋机器博弈系统中,提出基于时间差分算法的围棋机器博弈系统模型,该博弈系统具有一定的自学习能力,能在不断的对弈中逐步提高博弈能力.通过与采用α-β搜索算法的博弈系统进行实际对弈,证明了该方法的可行性.  相似文献   

5.
雷捷维  王嘉旸  任航  闫天伟  黄伟 《计算机工程》2021,47(3):304-310,320
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜索树扩展过程中,采用Double DQN输出的估值设计估值函数并在限定搜索层数内获得分支估值,同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在Double DQN模型训练过程中,将麻将信息编码为特征数据输入神经网络获得估值,使用Expectimax搜索算法得到最优动作以改进探索策略。实验结果表明,与Expectimax搜索算法、Double DQN算法等监督学习算法相比,该算法在麻将游戏上胜率与得分更高,具有更优异的博弈性能。  相似文献   

6.
分布式博弈树搜索算法   总被引:1,自引:0,他引:1  
本文提出了分布式博弈树搜索DDS算法,从通信开销、存储开销、加速比等方面分析了算法性能,并与SSS和α-β算法在搜索结点个数方面作了比较,模拟实验表明DDS是一种高效实用的分布式搜索算法。  相似文献   

7.
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。  相似文献   

8.
机器博弈作为人工智能研究的重要分支,可研究的内容极为广泛。介绍现在计算机博弈中主流的搜索算法,并将它们有机的结合起来,给出一个搜索的主体框架,为博弈树研究者提供启发和参考。  相似文献   

9.
针对传统博弈搜索算法无法适用于多人非完备信息博弈,通过分析UCT-RAVE算法的原理和特性,提出了运用UCT-RAVE算法与蒙特卡罗抽样技术相结合的方法.通过蒙特卡罗抽样技术将非完备信息提取为有一定可信度的完备信息,运用UCT-RAVE算法基于此完备信息进行搜索,结合多次蒙特卡罗抽样下的最佳收益,选择最适行动.实例结果表明了该方法的可行性和有效性.  相似文献   

10.
杜秀全  程家兴 《微机发展》2007,17(1):216-218
计算机博弈是一种对策性游戏,是人工智能的主要研究领域之一,它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计,将生成的博弈树节点的估值过程和对博弈树搜索过程相结合,采用传统的Alpha-Beta剪枝和极大-极小原则方法给出了博弈程序设计的核心内容:包括博弈树搜索和估值函数两个方面,提出了对原算法的一种改进,该算法提高了搜索速度。实验结果验证了算法的有效性。  相似文献   

11.
针对苏拉卡尔塔棋“机-机”博弈需要人工参与的弊端,提出了构建苏拉卡尔塔棋计算机网络博弈平台的必要性,通过博弈平台实现自动对弈,而构建计算机博弈平台的核心技术之一就是吃子算法的实现。介绍了苏拉卡尔塔棋的三个要素,给出了一种用于计算机博弈平台的苏拉卡尔塔棋的存储结构。使用这种结构,给出了棋局的表示方法,建立了吃子循环队列,进而完成了适合于计算机博弈平台的吃子算法,实现了棋规。实验结果表明,这种存储结构高效可靠,吃子算法运行正确。该吃子算法可以应用于苏拉卡尔塔棋博弈平台的构建,并且这种存储结构和吃子算法对设计完成其他棋类的计算机博弈平台具有一定的参考价值。  相似文献   

12.
随着电脑游戏的不断发展,游戏的类型越来越多.除了那些发生在无限空间中的游戏或棋牌类游戏以外,大部分游戏需要确定运动物体和环境之间什么时候发生碰撞.本文论述了游戏实体间的碰撞探测、游戏实体与地板、天花板、墙壁等环境碰撞的碰撞探测的编程算法,并给出了用Java语言编写的主要代码.  相似文献   

13.
AI(Artificial Intelligence)即人工智能是在多种学科相互渗透的基础上发展起来的一门新兴边缘学科,在这一领域多以博弈为例进行研究。本文利用Xcode作为开发工具,根据博弈树的启发式搜索原理,设计一个五子棋程序,实现人与计算机的博弈。  相似文献   

14.
计算机博弈是人工智能领域的“果蝇”,备受人工智能领域研究者的关注,已然成为研究认知智能的有利平台。扑克类博弈对抗问题可建模成边界确定、规则固定的不完美信息动态博弈,计算机扑克 AI 需要具备不完全信息动态决策、对手误导欺诈行为识别以及多回合筹码和风险管理等能力。首先梳理了以德州扑克为代表的计算机扑克智能博弈的发展历程,其次针对计算机扑克智能博弈典型模型算法、关键技术以及存在的主要问题进行了综述分析,最后探讨了计算机扑克智能博弈的未来发展趋势和应用前景。  相似文献   

15.
通过对图像处理及人机博弈相关理论的研究,实现了一种中国象棋人机博弈机器人系统的设计。该系统通过摄像头采集棋盘图像,之后将图像传入计算机,同时计算机通过图像剪切方法和基于对数极坐标变换&傅里叶变换的模板匹配方法实现棋盘中棋子的定位与识别,之后调用中国象棋人机博弈算法得出下一步应进行的走法,计算机通过串口将走法信息传入下位机单片机中,单片机根据走法信息控制机械臂实现棋子的移动,完成与人的对弈过程。经测试,该系统能够完成基本的功能并且具有较好的稳定性。  相似文献   

16.
介绍了计算机游戏动画原理和实现方法,概述了DirectX用于开发游戏的接口技术,重点描述了游戏动画的后备缓冲模型及其算法的程序实现,介绍了一种8位深度调色板的设计和绘制技术,使窗口模式下游戏动画运行时,其它应用程序能正常工作。提出了有待探讨的窗口模式下真彩色游戏动画的绘制问题。  相似文献   

17.
吕艳辉  宫瑞敏 《计算机工程》2012,38(11):163-166
计算机博弈程序难以处理局面估值问题。为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-TD(?),实现估值函数参数的自动调整。为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。以五子棋为应用背景,实现博弈系统RenjuTD。实验结果表明,该算法可使程序的博弈水平得到较大提高。  相似文献   

18.
An algorithm that determines the winner in a cyclic game in polynomial time is proposed. The two-person game occurs continuously on the edges of a directed graph until a vertex visited earlier is reached. If the weight of the resulting cycle is nonnegative, then the maximizing player wins; if this cycle has a negative weight, then the minimizing player wins. A polynomial estimate of the expected algorithm execution time is obtained under the condition that the weights of the game’s graph edges are distributed uniformly. A brief justification of the time estimate of the algorithm is given. Such games have applications in the validating the correctness of parallel-distributed computer systems, including problems of making up a feasible schedule with logical precedence conditions and preprocessing possibilities.  相似文献   

19.
Intuitive human‐computer interaction has been an active research area with the participation of both academic and industrial groups. It is an important technical and psychological element in computer games, digital product design, cybersports, etc. In this paper, we present our work on a 3D billiards game featuring a haptic interface. Most of the existing games available today concentrate on the development of sophisticated physics engines to obtain realistic motion of billiards balls or of sound engines for realistic sound effect. Our focus in this work is on the improved realism on the hitting action of the game with the aid of haptic device. We do so by computing accurate feedback force on the haptic handle, considering the exact point of contact and physically faithful collision response. Also presented is the physically based modeling of the game environment, including the collision interaction among billiards balls, and between the table and billiards balls. As a result, the players can enjoy a more realistic and pleasurable game compared to other existing 3D billiards games. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号