首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
游戏化学习具有提高学习兴趣、激发学习动机、提升问题求解能力、促进深度学习的优点。以德州扑克模拟器的实验项目设计为例,详细介绍了游戏的牌型表示、随机发牌、牌型判断、大小比较等算法的设计和实现过程,旨在加深对数据结构课程知识的理解与应用,逐步培养学生的算法设计和程序实现技能。  相似文献   

2.
张蒙  李凯  吴哲  臧一凡  徐航  兴军亮 《自动化学报》2022,48(4):1004-1017
以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型. 现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题, 导致智能体在面对不同对手时无法最大化自身收益. 为解决上述问题, 提出一种轻量高效且能快速适应对手策略变化进而剥削对手的不完美信息博弈求解框架. 本框架分为智能体离线训练和在线博弈两个阶段. 第1阶段基于演化学习思想训练智能体, 得到能够剥削不同博弈风格对手的策略神经网络. 在第2博弈阶段中, 智能体在线建模并适应未知风格对手, 利用种群策略集成的方法最大化剥削对手. 在两人无限注德州扑克环境中的实验结果表明, 本框架在面对动态对手策略时, 相比已有方法能够大幅提升博弈性能.  相似文献   

3.
为了利用历史经验知识提高德州扑克博弈水平,提出一种二人赌注无上限的德州扑克博弈系统架构:对于知识库模块,利用海量历史牌局训练得到基于CNN的深度学习网络模型并构建了一个专家经验库;在系统的搜索模块中,构建了一种分阶段的德州扑克博弈树,利用专家经验和历史经验引导德州扑克博弈树的展开;对于系统的估值核心模块,构建了一种基于哈希技术的牌型对照表,以提高系统判定胜负的效率。实验结果表明本文提出的博弈系统架构具有更高的对弈水平。  相似文献   

4.
李淑琴    陈子鹏    郑蓝舟    孟坤   《智能系统学报》2021,16(3):466-473
全国竞技二打一扑克锦标赛是国家体育总局棋牌运动管理中心推出的新兴项目,比赛采用复式赛赛制,然而这种赛制存在无法杜绝线上比赛作弊的问题,为此提出用同等牌力赛制来代替复式赛制进行比赛的设想。本文主要针对如何判定和选取具有同等牌力的初始手牌进行研究,提出用等级难度评估指标来计算初始手牌的难度,初始手牌难度相近的牌认定为同等牌力,并给出了同等牌力的选取方法;为保证一副牌所得等级难度评估指标的可靠性,提出用多个不同水平的“二打一AI程序”来代替真人打牌产生牌谱的方法。实验证明了同等牌力生成方法的有效性,本文提出的同等牌力方法应用于比赛是可行的。  相似文献   

5.
德州扑克中,相比于采用均衡策略求解的方法,对手利用是针对存在弱点的对手以获取更大收益的更有效方法.然而在面对一个全新对手时,在线条件下如何高效利用对手仍然是一大难题.现有方法常采用离线训练在线适应的方式来避开这一问题,即利用学习、演化等方法,通过海量离线训练来获得具有对手适应性的模型,使其能在比赛中适应不同的对手,而不是在比赛中针对一个新对手在线主动地优化自身策略.对此,以在线主动策略优化实现有效对手利用为目的,基于时间维的粒子定义提出一种基于粒子群优化的策略优化方法,将在线策略优化的思路引入德州扑克这种具有强随机性的博弈问题中,开展对手利用并实现在线比赛收益最大化.针对适应度计算受随机运气影响以及部分对手针对性策略难以优化的问题,提出一种基于局部最优解替代、全局最优解替代的改进粒子群优化算法(BR-PSO).实验结果表明,对于标准PSO方法难以针对的对手,所提出的方法能有效获得对手的针对性策略以实现最大化对手利用,而且优化策略的收益能够媲美基于手牌预测AI的收益.  相似文献   

6.
温盈盈  程冠杰  邓水光  尹建伟 《软件学报》2023,34(12):5887-5904
伴随着云计算的发展,以及软件即服务(SaaS)、方法即服务(FaaS)等服务框架的提出,数据中心作为服务的提供商,面临着持续性的资源管理挑战:一方面需要保证服务质量(quality of service, QoS),另一方面又需要控制资源成本.为了在提升资源使用率的同时确保负载压力在可承受范围内波动,一种精确衡量当前算力消耗程度的方法成为关键性的研究问题.传统的评估指标CPU利用率,由于虚拟化技术的成熟以及并行技术的发展,无法应对资源竞争所产生的干扰,失去了评估精度.而当前数据中心的主流处理器基本都开启了超线程技术,这导致评估超线程处理器算力消耗程度的需求亟待解决.为了应对这一评估挑战,基于超线程机制的理解以及线程行为的建模,提出一种评估超线程处理器算力消耗的方法 APU.同时考虑到不同权限的用户能访问的系统层级不同,还提出了两种实现方案:一种基于硬件层支持的实现,以及一种基于操作系统层支持的实现. APU方法利用传统CPU利用率指标作为输入,没有其他维度的需求,免去了新监测工具的开发部署代价,也无需特殊硬件体系结构的支持,确保该方法的通用性和易用性.最后通过SPEC基准测试程序进一步...  相似文献   

7.
刘镇  杨晓元  严波涛 《计算机应用》2009,29(7):1836-1838
安全多方计算是密码学中的一个重要研究领域,在保障信息安全中发挥着极其重要的作用。智力扑克游戏是指利用网络玩扑克牌,它可以视为一种特殊的安全多方计算。根据智力扑克游戏的有关要求,结合超椭圆曲线密码体制的优点,提出了一种恶意模型下安全的智力扑克协议,证明了协议的正确性,分析了在恶意模型下协议的安全性,给出了协议的计算复杂度和通信复杂度。  相似文献   

8.
智力扑克是一种特定场景的安全多方计算,近些年来,学术界对智力扑克协议的研究基本都是基于可信第三方的.利用语义安全的加密体制,结合同时生效签名算法,巧妙地设计了一种不安全信道下无可信第三方的智力扑克协议.该协议能很好地确保游戏双方的公平性、能有效抵抗重放攻击,同时还具有不可否认性、不可伪造性和游戏过程可追踪性等优点.  相似文献   

9.
在不确定信息的复杂环境下进行决策是现实中人们经常面对的困难之一,因此具有能够进行良好决策的能力被视为人工智能的重要能力之一.而游戏类型的博弈作为对现实世界的一种高度抽象,具有良定义、易检验算法优劣等特点,成为研究的主流.其中以掼蛋为代表的扑克类博弈不仅具有他人手牌未知这样的难点,还由于可选出牌动作与他人手牌情况数量庞大等特点,难以进行高效求解.因此,提出了一种软深度蒙特卡洛(soft deep Monte Carlo,SDMC)求解方法.该方法能够更好地融合领域知识,加快策略学习速度,并采用软动作采样策略调整实时决策,提升策略胜率.所提出的SDMC方法训练出的策略模型参加第2届“中国人工智能博弈算法大赛”时获得冠军.与第1届比赛冠军策略和第2届其他策略模型的实验对比证明了该方法在解决掼蛋扑克博弈中的有效性.  相似文献   

10.
信息系统效能评估的一种方法   总被引:7,自引:0,他引:7  
本文从分析影响信息系统效能的主要因素入手,建立了信息系统效能的层次结构模型,提出了一种信息系统效能评估的方法,对信息系统效能的评估进行了探讨与尝试。  相似文献   

11.
This paper discusses the implementation, architecture, and use of a graphical web‐based application called ReliaCloud‐NS that allows users to (1) evaluate the reliability of a cloud computing system (CCS) and (2) design a CCS to a specified reliability level for both public and private clouds. The software was designed with a RESTful application programming interface for performing nonsequential Monte Carlo simulations to perform reliability evaluations of a CCS. Simulation results are stored and presented to the user in the form of interactive charts and graphs from within a web browser. The software contains multiple types of CCS components, simulations, and virtual machine allocation schemes. ReliaCloud‐NS also contains a novel feature that evaluates CCS reliability across a range of varying virtual machine allocations and establishes and graphs a CCS reliability curve. This paper discusses the software architecture, the interactive web‐based interface, and the different types of simulations available in ReliaCloud‐NS and presents an overview of the results generated from a simulation.  相似文献   

12.
Sensitivity analysis is a powerful technique used to determine robustness, reliability and efficiency of a model. The main problem in this procedure is the evaluating total sensitivity indices that measure a parameter’s main effect and all the interactions involving that parameter. From a mathematical point of view this problem is presented by a set of multidimensional integrals. In this work a simple adaptive Monte Carlo technique for evaluating Sobol’ sensitivity indices is developed. A comparison of accuracy and complexity of plain Monte Carlo and adaptive Monte Carlo algorithms is presented. Numerical experiments for evaluating integrals of different dimensions are performed.  相似文献   

13.
In this paper we explore ways to study the zero temperature limit of quantum statistical mechanics using Quantum Monte Carlo simulations. We develop a Quantum Monte Carlo method in which one fixes the ground state energy as a parameter. The Hamiltonians we consider are of the form H=H0+λV with ground state energy E. For fixed H0 and V, one can view E as a function of λ whereas we view λ as a function of E. We fix E and define a path integral Quantum Monte Carlo method in which a path makes no reference to the times (discrete or continuous) at which transitions occur between states. For fixed E we can determine λ(E) and other ground state properties of H.  相似文献   

14.
高分子链分子量巨大而且分散,结构复杂多变,存在大量不确定的问题,给理论和实验研究造成许多困难。本文建立了一种基于高分子Monte Carlo模拟算法,分析分子蠕动阻力的模型。用链动力学法构造8配位点键长涨落格子链多链体系,通过高分子链的运动使任意的初始有序态演化到平衡态,可同时获得体系的动态和静态性质。将重要性抽样法和高分子多链体系的链动力学构造法,在键长涨落模型中结合起来,形成多链体系的链动力学求解法。引入空格扩散算法,用以研究高浓度态的高分子体系。统计平衡后元胞内高分子多链体系在链动力学算法作用下蠕动失败机率,对高聚物多链体系内分子蠕动的困难程度的定量模拟,能更直观分析高分子玻璃化转变的现象。  相似文献   

15.
计算机博弈是人工智能领域的“果蝇”,备受人工智能领域研究者的关注,已然成为研究认知智能的有利平台。扑克类博弈对抗问题可建模成边界确定、规则固定的不完美信息动态博弈,计算机扑克 AI 需要具备不完全信息动态决策、对手误导欺诈行为识别以及多回合筹码和风险管理等能力。首先梳理了以德州扑克为代表的计算机扑克智能博弈的发展历程,其次针对计算机扑克智能博弈典型模型算法、关键技术以及存在的主要问题进行了综述分析,最后探讨了计算机扑克智能博弈的未来发展趋势和应用前景。  相似文献   

16.
This paper addresses one of the key objectives of the supply chain strategic design phase, that is, the optimal selection of suppliers. A methodology for supplier selection under uncertainty is proposed, integrating the cross‐efficiency data envelopment analysis (DEA) and Monte Carlo approach. The combination of these two techniques allows overcoming the deterministic feature of the classical cross‐efficiency DEA approach. Moreover, we define an indicator of the robustness of the determined supplier ranking. The technique is able to manage the supplier selection problem considering nondeterministic input and output data. It allows the evaluation of suppliers under uncertainty, a particularly significant circumstance for the assessment of potential suppliers. The novel approach helps buyers in choosing the right partners under uncertainty and ranking suppliers upon a multiple sourcing strategy, even when considering complex evaluations with a high number of suppliers and many input and output criteria.  相似文献   

17.
In this paper, we present DEMC, a deep dual-encoder network to remove Monte Carlo noise efficiently while preserving details. Denoising Monte Carlo rendering is different from natural image denoising since inexpensive by-products (feature buffers) can be extracted in the rendering stage. Most of them are noise-free and can provide sufficient details for image reconstruction. However, these feature buffers also contain redundant information. Hence, the main challenge of this topic is how to extract useful information and reconstruct clean images. To address this problem, we propose a novel network structure, dual-encoder network with a feature fusion sub-network, to fuse feature buffers firstly, then encode the fused feature buffers and a noisy image simultaneously, and finally reconstruct a clean image by a decoder network. Compared with the state-of-the-art methods, our model is more robust on a wide range of scenes, and is able to generate satisfactory results in a significantly faster way.  相似文献   

18.
FeynRules  is a Mathematica-based package which addresses the implementation of particle physics models, which are given in the form of a list of fields, parameters and a Lagrangian, into high-energy physics tools. It calculates the underlying Feynman rules and outputs them to a form appropriate for various programs such as CalcHep, FeynArts, MadGraph, Sherpa  and Whizard. Since the original version, many new features have been added: support for two-component fermions, spin-3/2 and spin-2 fields, superspace notation and calculations, automatic mass diagonalization, completely general FeynArts  output, a new universal FeynRules  output interface, a new Whizard  interface, automatic 1→212 decay width calculation, improved speed and efficiency, new guidelines for validation and a new web-based validation package. With this feature set, FeynRules  enables models to go from theory to simulation and comparison with experiment quickly, efficiently and accurately.  相似文献   

19.
由于经典蒙特卡洛方法的仿真效率不高,文中利用概率论和数理统计的基本原理,可以推导得到加权蒙特卡洛方法.加权蒙特卡罗方法不但能有效的缩小了样本方差,还能提高目标事件出现概率,相当于提高了样本的抽样效率,从而提高了仿真效率.与此同时,文中分别利用经典蒙特卡洛和加权蒙特卡洛这两种方法对典型目标进行了仿真计算,仿真计算最终证明了加权蒙特卡洛方法的仿真效率明显优于经典蒙特卡洛方法,能使仿真工作量成数量级的衰减.  相似文献   

20.
This article describes a simple and cost effective evaluation method based on post-editing. The results of an experiment using this method, to investigate the improvement of an MT system over time are given, along with some practicalities in carrying through the evaluation (time, effort etc.)  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号