期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘知青吴修竹《控制理论与应用》2016,33(12):1685-1687

随着人工智能在各个领域的应用,越来越多的问题通过人工智能得到更优的解决,但是围棋因其本身的复杂度一直是人工智能领域的难解之题.AlphaGo团队利用了人工智能中的一个重要分支—深度学习训练了一款围棋人工智能程序,并在2016年3月与职业九段选手李世石的对弈中以4:1的比分获胜,受到了大众的广泛关注.本文介绍了AlphaGo这一程序背后的复杂的网络构造以及不同网络的优缺点. 相似文献

2.

阿法狗围棋系统的简要分析 总被引：1，自引：0，他引：1

田渊栋《自动化学报》2016,42(5):671-675

谷歌的围棋系统阿法狗(AlphaGo)在三月的比赛中以4:1的成绩击败了围棋世界冠军李世石, 大大超过了许多人对计算机围棋程序何时能赶上人类职业高手的预期(约10～30年).本文在技术层面分析了阿法狗系统的组成部分, 并基于它过去的公开对局预测了它可能的弱点. 相似文献

3.

深度强化学习进展: 从AlphaGo到AlphaGo Zero 总被引：1，自引：0，他引：1

赵冬斌唐振韬邵坤朱圆恒《控制理论与应用》2017,34(12):1529-1546

2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果.并进一步研发出算法形式更为简洁的AlphaGo Zero,其采用完全不基于人类经验的自学习算法,完胜AlphaGo,再一次刷新人们对深度强化学习的认知.深度强化学习结合了深度学习和强化学习的优势,可以在复杂高维的状态动作空间中进行端到端的感知决策.本文主要介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展.首先回顾对深度强化学习的成功作出突出贡献的主要算法,包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展.然后给出AlphaGo Zero的详细介绍和讨论,分析其对人工智能的巨大推动作用.并介绍了深度强化学习在游戏、机器人、自然语言处理、智能驾驶、智能医疗等领域的应用进展,以及相关资源进展.最后探讨了深度强化学习的发展展望,以及对其他潜在领域的人工智能发展的启发意义. 相似文献

4.

从AlphaGo到BetaGo——基于任务可完成性分析的定性人工智能的定量实现

苏剑波陈叶飞马哲黄瑶向国菲陈若冰《控制理论与应用》2016,33(12):1572-1583

AlphaGo程序利用深度学习算法和蒙特卡洛树搜索算法在围棋领域取得了突破性进展,用定量分析技术实现了围棋这一传统定性式的任务.此次突破,实现了对定性人工智能的定量研究,这对人工智能体的研究具有重要借鉴意义.对于人工智能体而言,执行任务前需要考虑任务的可完成性,对下棋任务而言,任务目标是取得胜利,因此,本文先从任务可完成性角度出发,分别从特征完备性、表征空间构建及基于表征空间的搜索角度分析AlphaGo程序.其次,人工智能体在任务完成过程中,不可避免地受到各种扰动的影响,对AlphaGo而言,本质是对人下棋过程的建模,因此,本文从抗干扰的角度出发,分析了AlphaGo的缺陷.再者,人工智能的研究是人类用科学技术的方式模拟大脑活动的过程.AlphaGo所体现出的围棋思想与人类棋手的围棋美学之间的差异,也是定量分析与定性描述之间的差异.因此,本文从美感评价角度对AlphaGo进行了分析和展望.通过上述三个角度,本文诠释了AlphaGo程序所包含的原理以及对定量化分析定性人工智能体研究的借鉴意义.本文认为,AlphaGo虽然取得了里程碑式的进展,但在定性描述(如:美学,艺术)以及系统未知扰动方面仍存在大量问题值得研究.人工智能的跨越式发展,即从Alpha级别提升至Beta级别,应该包含对事物定性分析的能力.最后,希望人工智能算法的研究工作者通过本文能更关注于挖掘定性描述与定量分析之间的关联,并进一步将人工智能算法提升至BetaGo乃至更高. 相似文献

5.

Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond

Fei-Yue Wang Jun Jason Zhang Xinhu Zheng Xiao Wang Yong Yuan Xiaoxiao Dai Jie Zhang Liuqing Yang 《IEEE/CAA Journal of Automatica Sinica》2016,3(2):113-120

An investigation on the impact and significance of the Alpha Go vs. Lee Sedol Go match is conducted, and concludes with a conjecture of the Alpha Go Thesis and its extension in accordance with the Church-Turing Thesis in the history of computing. It is postulated that the architecture and method utilized by the Alpha Go program provide an engineering solution for tackling issues in complexity and intelligence. Specifically,the Alpha Go Thesis implies that any effective procedure for hard decision problems such as NP-hard can be implemented with Alpha Go-like approach. Deep rule-based networks are proposed in attempt to establish an understandable structure for deep neural networks in deep learning. The success of Alpha Go and corresponding thesis ensure the technical soundness of the parallel intelligence approach for intelligent control and management of complex systems and knowledge automation. 相似文献

6.

Artificial intelligence and IP

《World Patent Information》2016

相似文献

7.

深度强化学习综述: 兼论计算机围棋的发展 总被引：2，自引：0，他引：2

赵冬斌邵坤朱圆恒李栋陈亚冉王海涛刘德荣周彤王成红《控制理论与应用》2016,33(6):701-717

深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法.自提出以来,深度强化学习在理论和应用方面均取得了显著的成果.尤其是谷歌深智(Deep Mind)团队基于深度强化学习方法研发的计算机围棋"初弈号–Alpha Go",在2016年3月以4:1的大比分战胜了世界围棋顶级选手李世石(Lee Sedol),成为人工智能历史上一个新里程碑.为此,本文综述深度强化学习的发展历程,兼论计算机围棋的历史,分析算法特性,探讨未来的发展趋势和应用前景,期望能为控制理论与应用新方向的发展提供有价值的参考. 相似文献