首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   104篇
  国内免费   12篇
  完全免费   35篇
  自动化技术   151篇
  2018年   3篇
  2017年   2篇
  2016年   5篇
  2015年   13篇
  2014年   7篇
  2013年   6篇
  2012年   13篇
  2011年   10篇
  2010年   18篇
  2009年   5篇
  2008年   10篇
  2007年   8篇
  2006年   7篇
  2005年   7篇
  2004年   8篇
  2003年   7篇
  2002年   5篇
  2001年   7篇
  2000年   3篇
  1998年   2篇
  1997年   1篇
  1991年   1篇
  1990年   1篇
  1988年   1篇
  1986年   1篇
排序方式: 共有151条查询结果,搜索用时 31 毫秒
1.
强化学习研究综述   总被引:65,自引:1,他引:64       下载免费PDF全文
高阳  陈世福  陆鑫 《自动化学报》2004,30(1):86-100
摘要强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为 机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类 图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结 合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学 习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向.  相似文献
2.
一种基于强化学习的学习Agent   总被引:24,自引:2,他引:22  
强化学习通过感知环境状态和从环境中获得不确定奖赏值来学习动态系统的最优行为策略,是构造智能Agent的核心技术之一,在面向Agent的开发环境AODE中扩充BDI模型,引入策略和能力心智成分,采用强化学习技术实现策略构造函数,从而提出一种基于强化学习技术的学习Agent,研究AODE中自适应Agent物结构和运行方式,使智能Agent具有动态环境的在线学习能力,有效期能够有效地满足Agent各种心智要求。  相似文献
3.
基于Markov对策的多Agent强化学习模型及算法研究   总被引:18,自引:0,他引:18  
在MDP,单Agent可以通过强化学习来寻找问题的最优解。但在多Agent系统中,MDP模型不再适用。同样极小极大Q算法只能解决采用零和对策模型的MAS学习问题。文中采用非零和Markov对策作为多Agent系统学习框架,并提出元对策强化学习的学习模型和元对策Q算法。理论证明元对策Q算法收敛在非零和Markov对策的元对策最优解。  相似文献
4.
基于XML文档的关系数据库与面向对象数据库之间的信息交互   总被引:16,自引:2,他引:14  
针对传统关系数据库与面向对象数据库之间信息交换所在的不足,该文分析了XML文档和关系数据库模型/面向对象数据库模型的对应关系,提出了以XML文档为中介的数据库间信息交互的算法,最后举例说明了如何利用XML文档来实现数据库间的信息交互。  相似文献
5.
基于SQL的XML到关系数据库的转换方法   总被引:10,自引:1,他引:9  
XML的数据特性使其与数据库的关系日益密切。研究了利用XML描述关系数据库结构的方法。该方法使用XSL将描述数据库抽象结构的XML转换到各数据库支持的SQL,进而生成具体的物理表结构。实验证明了这种方法的有效性。  相似文献
6.
Web智能研究现状与发展趋势   总被引:10,自引:0,他引:10  
Web智能是近年出现的一个崭新的研究方向,它是人工智能和高级信息技术在新的Web和Internet环境下相互融合的产物.首先从总体上讨论了Web智能的概念、研究内容和功能技术框架,然后分别就Web智能的几个核心方面的研究现状进行了综述,主要包括语义Web与ontology,Web Agent和Web挖掘等,并进一步给出了它们的研究重点和发展方向,最后是关于Web智能的研究展望和面临的挑战,指出智慧Web是Web智能研究的目标和中长期发展方向.  相似文献
7.
基于神经网络的强化学习算法研究   总被引:8,自引:0,他引:8  
BP神经网络在非线性控制系统中被广泛运用,但作为有导师监督的学习算法,要求批量提供输入输出对神经网络训练,而在一些并不知道最优策略的系统中,这样的输入输出对事先并无法得到,另一方面,强化学习从实际系统学习经验来调整策略,并且是一个逼近最优策略的过程,学习过程并不需要导师的监督。提出了将强化学习与BP神经网络结合的学习算法-RBP模型。该模型的基本思想是通过强化学习控制策略,经过一定周期的学习后再用学到的知识训练神经网络,以使网络逐步收敛到最优状态。最后通过实验验证了该方法的有效性及收敛性。  相似文献
8.
一种劝说式多Agent多议题协商方法   总被引:8,自引:0,他引:8  
多Agent系统中的协商问题往往由许多议题组成,导致问题空间十分庞大.传统的协商方法通过对问题空间进行穷尽搜索来找到最优解,并不适合多议题协商.而且,传统的方法不考虑协商偏好变化的情况,使得Agent在不完全及不正确环境下找到的最优解并不合理.提出一种劝说式多Agent多议题协商方法.借助信念修正这一有效的推理工具,协商Agent能够在协商过程中接受协商对手的劝说,考虑对手对协商议题的偏好,并根据一种基于辩论的信念修正方法调整自身的偏好.这样就能够使协商Agent对变化的协商环境具备适应性,从而提高协商的效率及正确率,快速准确地达成协议.  相似文献
9.
基于Web的B/S结构供电安全系统的实现技术   总被引:7,自引:0,他引:7  
研究了基于Web的B/S结构系统设计方法和关键技术,并通过供电安全系统通用查询界面的设计讨论关键技术的实现方法。实践表明,所采用的一系列方法是有效的。  相似文献
10.
多Agent系统中强化学习的研究现状和发展趋势   总被引:7,自引:1,他引:6       下载免费PDF全文
本文对有关强化学习及其在多Agent系统中的应用等方面的研究现状、关键技术、问题和发展趋势进行了综述和讨论,试图给出强化学习目前研究的重点和发展方向。主要内容包括:(1)强化学习的框架结构;(2)几个有代表性的强化学习方法;(3)多Agent系统中强化学习的应用和问题。最后讨论了多Agent系统中应用强化学习所面临的挑战。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号