首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 19 毫秒
1.
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。  相似文献   

2.
针对苏拉卡尔塔棋“机-机”博弈需要人工参与的弊端,提出了构建苏拉卡尔塔棋计算机网络博弈平台的必要性,通过博弈平台实现自动对弈,而构建计算机博弈平台的核心技术之一就是吃子算法的实现。介绍了苏拉卡尔塔棋的三个要素,给出了一种用于计算机博弈平台的苏拉卡尔塔棋的存储结构。使用这种结构,给出了棋局的表示方法,建立了吃子循环队列,进而完成了适合于计算机博弈平台的吃子算法,实现了棋规。实验结果表明,这种存储结构高效可靠,吃子算法运行正确。该吃子算法可以应用于苏拉卡尔塔棋博弈平台的构建,并且这种存储结构和吃子算法对设计完成其他棋类的计算机博弈平台具有一定的参考价值。  相似文献   

3.
针对中国象棋博弈中较为高效的α-β剪枝算法进行研究,以提升其效率。依据α-β剪枝算法的效率与子节点扩展的排列顺序高度相关的事实及中国象棋自身的特点,从优化着法的排列顺序入手,设计出启发能力较强的着法排列方案,并进一步提出扩大窗口的内部迭代加深算法对上述着法排列方案进行修正,从而使着法顺序得到进一步的优化。实验数据表明,提出的方法可以明显提升α-β剪枝的效率。  相似文献   

4.
吕艳辉  宫瑞敏 《计算机工程》2012,38(11):163-166
计算机博弈程序难以处理局面估值问题。为此,结合时间差分算法和反向传播神经网络,设计一种局面估值算法BP-TD(?),实现估值函数参数的自动调整。为提高博弈训练的性能,针对开局和中局,提出分阶段设置参数值的策略。以五子棋为应用背景,实现博弈系统RenjuTD。实验结果表明,该算法可使程序的博弈水平得到较大提高。  相似文献   

5.
近些年来,爱恩斯坦棋作为一个在中国刚刚兴起不久的棋类游戏,其计算机博弈算法的研究还相对较少。该文尝试使用静态算法来让程序做出一个相对有利于我方的走棋路线,也着力实现一个基于枚举和静态分析策略的静态算法,并且提供一个参考的局面评估算法。经过大量模拟实验证明,该算法具有一定的有效性和实用性。  相似文献   

6.
在考虑下棋操作对棋盘影响的局部性后,提出了棋博弈的Δfeature状态估值算法,通过计算博弈树中相邻结点的特征变化来避免在叶结点上扫描整个棋盘,有效地减少了静态估值的时间开销。若棋子影响的局部范围足够小,还可以考虑将局部范围的所有情况列成表,以查表代替棋形匹配。ΔFeature状态估值算法也可以与其它优化博弈树搜索的方法一同使用,达到更好的效果。  相似文献   

7.
一种博弈树静态估值算法--△Feature状态估值   总被引:1,自引:0,他引:1  
在考虑下棋操作对棋盘影响的局部性后,提出了棋博弈的△feature状态估值算法,通过计算博弈树中相邻结点的特征变化来避免在叶结点上扫描整个棋盘,有效地减少了静态估值的时间开销。若棋子影响的局部范围足够小,还可以考虑将局部范围的所有情况列成表,以查表代替棋形匹配。ΔAFeature状态估值算法也可以与其它优化博弈树搜索的方法一同使用,达到更好的效果。  相似文献   

8.
目前国际象棋、围棋、五子棋等棋类游戏均已取得较为显著的成果,而10×10棋盘的西洋跳棋尚待破解。局面评估是计算机博弈系统智能化的重要影响因素之一,现有的西洋跳棋多采用静态估值和遗传算法等棋局评估方法,准确性和训练效率均有待改善。对此,本文总结和分析了现有的西洋跳棋评估算法,并在此基础上提出了基于神经网络和强化学习相结合的西洋跳棋评估算法,使西洋跳棋具有更好的自适应学习能力。通过分析表明,使用该算法的西洋跳棋博弈系统可以有效提高其计算机博弈水平。  相似文献   

9.
张明亮  吴俊  李凡长 《计算机应用》2012,32(7):1969-1972
针对五子棋机器博弈需借助棋型评估棋局产生的速度瓶颈,提出了棋型识别粒度与搜索深度相关联的多层架构评估函数设计方法。实验证实粗颗粒度估值在深层搜索时整体效率更高;多层次判读棋型能明显加快评估速度;走法生成函数引入快速评估,提前进行博弈树自然剪枝收效显著;非关键棋型依据棋局浮动分值平衡搜索深度,对五子棋亦见成效;以及估值函数针对性地延伸评估来减少地平线效应的开销更少;从而表明估值函数动态评估更加合理。  相似文献   

10.
解决机器博弈问题的传统方法是在博弈树上采用各种搜索算法,结合局面评估,来生成相应的走法。本文将遗传算法引入到人机博弈中来,通过对搜索树进行选择,交叉,变异等操作,得到可能包含更优解的博弈树,运用评估函数估值,从而产生当前局面下的最佳着法。  相似文献   

11.
解决机器博弈问题的传统方法是在博弈树上采用各种搜索算法,结合局面评估,来生成相应的走法。本文将遗传算法引入到人机博弈中来,通过时搜索树进行选择,交叉,变异等操作,得到可能包含更优解的博弈树,运用评估函数估值,从而产生当前局面下的最佳着法。  相似文献   

12.
针对支持向量机(SVM)的惩罚因子和核函数参数选取难度较大的问题,提出利用改进的人工蜂群算法优化支持向量机相关参数的方法.为了提高ABC算法的寻优能力,在原始ABC算法的搜索公式中引入全局搜索因子.利用UCI数据集对优化后的模型进行验证,证明了其良好的性能.将其应用于船舶压载水系统的故障诊断,实验结果表明,IABC算法...  相似文献   

13.
文章旨在介绍基于主变量导向搜索(Principal Variation Search,PVS)算法的苏拉卡尔塔棋博弈系统的设计与实现。为了优化搜索策略,提高搜索效率和决策准确性,文章选用将Alpha-Beta剪枝和主要变例相结合的PVS搜索算法设计与实现苏拉卡尔塔棋博弈系统。在评估函数方面,综合考虑盘面价值、棋子价值、移动范围以及攻击范围等关键因素,从而准确评估当前棋局状态。本研究的贡献在于实现了一个苏拉卡尔塔棋博弈系统,并为该领域的未来研究奠定了坚实基础。  相似文献   

14.
面向机器博弈的即时差分学习研究   总被引:1,自引:0,他引:1  
以六子棋机器博弈为应用背景,实现了基于即时差分学习的估值函数权值调整自动化.提出了一种新的估值函数设计方案,解决了先验知识与多层神经元网络结合的问题.结合具体应用对象的特性,提出了对即时差分序列进行选择性学习的方法,在一定程度上避免了无用状态的干扰.经过10020盘的自学习训练,与同一个程序对弈,其胜率提高了8%左右,具有良好的效果.  相似文献   

15.
文章基于计算机博弈的基本理论,对幻影围棋系统进行了研究。整个棋局分为三个阶段:开局、中盘和收尾。每个阶段都对应着不同的策略与应对方法,根据这些不同的阶段,设计算法,将算法与局势结合起来,从而增大胜率。根据我们从多次对弈获得的数据,选择有效和适当的定式,可以减少搜索时间,提高己方的胜率。该系统将使用Alpha-Beta剪枝算法以弥补蒙特卡洛算法的不足。  相似文献   

16.
围棋机器博弈是机器博弈中重要的分支之一,其庞大的博弈空间给机器博弈研究者带来了巨大挑战.目前围棋机器博弈多采用静态估值搜索与蒙特卡洛树搜索,故将时间差分算法引入至九路围棋机器博弈系统中,提出基于时间差分算法的围棋机器博弈系统模型,该博弈系统具有一定的自学习能力,能在不断的对弈中逐步提高博弈能力.通过与采用α-β搜索算法的博弈系统进行实际对弈,证明了该方法的可行性.  相似文献   

17.
当前在线广告的业务场景下,线性模型没有充分考虑到数据高维、稀疏性、非线性等特点。针对这些问题,引入了基于梯度提升决策树算法的特征提取方法,提出了基于FTRL(Follow-The-Regularized-Leader)优化算法的因子分解机模型。FTRL优化算法能有效地学习到特征之间存在的非线性关系,使不同参数可以自适应不同学习率,并加入了混合正则项。实验结果证明基于FTRL优化算法的因子分解机模型能有效提高广告点击事件的预测准确率。  相似文献   

18.
杜秀全  程家兴 《微机发展》2007,17(1):216-218
计算机博弈是一种对策性游戏,是人工智能的主要研究领域之一,它涉及人工智能中的搜索方法、推理技术和决策规划等。目前广泛研究的是确定的、二人、零和、完备信息的博弈搜索。文中通过一个黑白棋程序的设计,将生成的博弈树节点的估值过程和对博弈树搜索过程相结合,采用传统的Alpha-Beta剪枝和极大-极小原则方法给出了博弈程序设计的核心内容:包括博弈树搜索和估值函数两个方面,提出了对原算法的一种改进,该算法提高了搜索速度。实验结果验证了算法的有效性。  相似文献   

19.
本文以民间的扁担棋为对象,探讨了基于规则的人机博弈系统的实现方法与步骤,通过研究分析,给出了形式化的公共游戏规则和有利取胜原则,以此为基础提出了获益函数的概念,设计出一个有限递归算法解决了K度获益函数的计算问题,在这些工作的基础上最终用pascal语言实现了扁担棋人机对弈系统。该系统经10名学生对弈实验,机器获胜率在90%以上,说明系统设计是成功的。  相似文献   

20.
“久”棋是藏族人民的传统棋类游戏,游戏过程分为布局阶段和战斗阶段,布局的质量对弈棋结果影响很大。与围棋博弈智能软件战胜人类高手的情况比较,“久”棋博弈研究几乎空白。为了拓宽机器博弈研究的游戏范围,开发具有较高棋力的“久”棋软件,作者开展了基于棋型的“久”棋计算机博弈研究。通过实地考察,在四川阿坝地区采集了约300局有效的“久”棋对弈数据,提取了常见棋型,分别为棋型命名为三角、三子、二子、对角、四子等。在布局阶段,采用模式匹配算法提高棋型的匹配速度。在布局和战斗阶段,基于棋型,设计了具有优先级别的防守、攻击、连子策略。采用C语言开发了“久”棋博弈软件,该软件具有人人对弈、人机对弈、自动录制棋谱等功能。该软件在2016年四川省阿坝县第七届“体彩杯”藏棋比赛中成功开展了人机对弈,但是棋力有待提高。结果表明,基于棋型的攻防策略能够有效地应用于“久”棋计算机博弈。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号