排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
2.
3.
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜索树扩展过程中,采用Double DQN输出的估值设计估值函数并在限定搜索层数内获得分支估值,同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在Double DQN模型训练过程中,将麻将信息编码为特征数据输入神经网络获得估值,使用Expectimax搜索算法得到最优动作以改进探索策略。实验结果表明,与Expectimax搜索算法、Double DQN算法等监督学习算法相比,该算法在麻将游戏上胜率与得分更高,具有更优异的博弈性能。 相似文献
4.
5.
6.
7.
我国建筑业是一个信息化水平低、劳动密集型的行业,针对建设工程项目劳动力资源短缺的问题,以动态控制理论为基础,通过BIM模型集成WBS精细化的施工任务、工程量、流水段等信息;使用数据采集App、智能闸机、劳务管理系统、视频监控等智能建造手段提高施工信息采集的效率和准确性;将BIM模型工程量信息、现场采集的施工进度和劳动力信息导入VICO分析平台,精确计算劳务人员的工效,对比里程碑节点的实际情况,提出预警并给出科学的劳动力资源优化建议,为工程实现动态控制提供了科学依据。 相似文献
1