首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 359 毫秒

1.  强化学习研究综述  
   陈学松  杨宜民a《计算机应用研究》,2010年第27卷第8期
   在未知环境中,关于agent的学习行为是一个既充满挑战又有趣的问题,强化学习通过试探与环境交互获得策略的改进,其学习和在线学习的特点使其成为机器学习研究的一个重要分支。介绍了强化学习在理论、算法和应用研究三个方面最新的研究成果,首先介绍了强化学习的环境模型和其基本要素;其次介绍了强化学习算法的收敛性和泛化有关的理论研究问题;然后结合最近几年的研究成果,综述了折扣型回报指标和平均回报指标强化学习算法;最后列举了强化学习在非线性控制、机器人控制、人工智能问题求解、多agent 系统问题等若干领域的成功应用和未来的发展方向。    

2.  强化学习的模型、算法及应用  被引次数:1
   战忠丽  王强  陈显亭《电子科技》,2011年第24卷第1期
   强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函数估计算法,最后介绍了强化学习的应用情况及未来研究方向。    

3.  强化学习研究综述  
   YU Jian-peng  GUI Jian-ping《数字社区&智能家居》,2008年第15期
   强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支,该文首先介绍了强化学习的基本原理结构和各种算法;然后介绍了近年来强化学习的应用等热点问题。    

4.  强化学习原理、算法及应用  
   黄炳强  曹广益  王占全《河北工业大学学报》,2006年第35卷第6期
   强化学习(ReinforcementLearningRL)是从动物学习理论发展而来的,它不需要有先验知识,通过不断与环境交互来获得知识,自主的进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视.本文综述了强化学习的基本原理,各种算法,包括TD算法、Q-学习和R学习等,最后介绍了强化学习的应用及其在多机器人系统中的研究热点问题.    

5.  强化学习理论在电力系统中的应用及展望  
   余涛  周斌  甄卫国《继电器》,2009年第37卷第14期
   强化学习理论是人工智能领域中机器学习方法的一个重要分支,也是马尔可夫决策过程的一类重要方法。所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。强化学习理论及其应用研究近年来日益受到国际机器学习和智能控制学术界的重视。系统地介绍了强化学习的基本思想和算法,综述了目前强化学习在安全稳定控制、自动发电控制、电压无功控制及电力市场等方面应用研究的主要成果与方法,并探讨了该课题在电力系统运行控制中的巨大潜力,以及与经典控制、神经网络、模糊理论和多Agent系统等智能控制技术的相互结合问题,最后对强化学习在电力科学领域的应用前景作出了展望。    

6.  强化学习理论在电力系统中的应用及展望  
   余涛  周斌  甄卫国《电力系统保护与控制》,2009年第37卷第14期
   强化学习理论是人工智能领域中机器学习方法的一个重要分支,也是马尔可夫决策过程的一类重要方法.所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大.强化学习理论及其应用研究近年来日益受到国际机器学习和智能控制学术界的重视.系统地介绍了强化学习的基本思想和算法,综述了目前强化学习在安全稳定控制、自动发电控制、电压无功控制及电力市场等方面应用研究的主要成果与方法,并探讨了该课题在电力系统运行控制中的巨大潜力,以及与经典控制、神经网络、模糊理论和多Agent系统等智能控制技术的相互结合问题,最后对强化学习在电力科学领域的应用前景作出了展望.    

7.  分层强化学习研究综述  
   《模式识别与人工智能》,2005年第18卷第5期
   强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.但是,强化学习一直被"维数灾"问题所困扰.近年来,分层强化学习方法引入抽象(Abstraction)机制,在克服"维数灾"方面取得了显著进展.作为理论基础,本文首先介绍了强化学习的基本原理及基于半马氏过程的Q-学习算法.然后介绍了3种典型的单Agent分层强化学习方法(Option、HAM和MAXQ)的基本思想,Q-学习更新公式,概括了各方法的本质特征,并对这3种方法进行了对比分析评价.最后指出了将单Agent分层强化学习方法拓展到多Agent分层强化学习时需要解决的问题.    

8.  多Agent系统中强化学习的研究现状和发展趋势  被引次数:7
   赵志宏 高阳 骆斌 陈世福《计算机科学》,2004年第31卷第3期
   本文对有关强化学习及其在多Agent系统中的应用等方面的研究现状、关键技术、问题和发展趋势进行了综述和讨论,试图给出强化学习目前研究的重点和发展方向。主要内容包括:(1)强化学习的框架结构;(2)几个有代表性的强化学习方法;(3)多Agent系统中强化学习的应用和问题。最后讨论了多Agent系统中应用强化学习所面临的挑战。    

9.  随机博弈框架下的多agent强化学习方法综述  被引次数:4
   宋梅萍  顾国昌  张国印《控制与决策》,2005年第20卷第10期
   多agent学习是在随机博弈的框架下,研究多个智能体间通过自学习掌握交互技巧的问题.单agent强化学习方法研究的成功,对策论本身牢固的数学基础以及在复杂任务环境中广阔的应用前景,使得多agent强化学习成为目前机器学习研究领域的一个重要课题.首先介绍了多agent系统随机博弈中基本概念的形式定义;然后介绍了随机博弈和重复博弈中学习算法的研究以及其他相关工作;最后结合近年来的发展,综述了多agent学习在电子商务、机器人以及军事等方面的应用研究,并介绍了仍存在的问题和未来的研究方向.    

10.  铜基合金的强化机理和研制现状  被引次数:6
   李本贵  于艳  曹志强  方园  李廷举《铸造》,2005年第54卷第10期
   在综述了铜合金强化原理的基础上,介绍了该类合金强化的最新技术及研究现状,并对其性能进行了展望.    

11.  实现酒精高效率发酵的控制途径  被引次数:5
   李雪雁《酿酒》,2002年第29卷第2期
   综述了实现酒精高效率发酵的控制途径,以及近年来高效率发酵技术的研究进展,具体介绍了提高发酵液中的酵母菌细胞密度,优化酵母菌发酵环境,强化淀粉糖化过程等技术方法,并指出其广阔的研究和应用前景。    

12.  基于强化学习的动态频谱分配研究  
   杜江  刘毅《数字通信》,2012年第39卷第4期
   首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术。    

13.  基于终身教育导向的成人学习策略体系的构建研究  
   李苏《建造师》,2015年第6期
   本文从成人学习策略的研究综述出发,探讨了成人学习策略的涵义及其特征,提出构建成人学习策略体系的意义和关于成人学习策略体系构建的几点设想:通过优化成人学习环境,激发与强化成人学生的学习动机,充分运用已有的知识经验,采取群体性协作共享的学习方式,进行筛选性的深度学习,并适时做出自我评价,进而保障成人学生的学习质量,达到事半功倍的良好效果。    

14.  分层强化学习研究进展  
   程晓北  沈晶  刘海波  顾国昌  张国印《计算机工程与应用》,2008年第44卷第13期
   强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但强化学习方法一直被维数灾难所困扰。近年来,分层强化学习方法在解决维数灾问题中取得了显著成果,并逐渐开始向多智能体系统推广,论文归纳分析这一领域目前的研究进展,并对迫切需要解决的一些问题和进一步的发展趋势作出探讨和展望。    

15.  多Agent强化学习方法与应用  
   郭凌云《福建电脑》,2015年第5期
   强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Agent强化学习是求解复杂问题的有效途径。多Agent系统比单Agent具有更强的问题求解能力,但多Agent的参与又增加了问题的复杂性。本文分析了多Agent强化学习方法的研究现状,总结了目前存在的主要问题及其解决方法,最后介绍了多Agent技术在实际问题中的部分应用。    

16.  强化学习中的迁移:方法和进展  被引次数:1
   王皓  高阳  陈兴国《电子学报》,2008年第36卷第Z1期
    传统机器学习方法认为不同的学习任务彼此无关,但事实上不同的学习任务常常相互关联.迁移学习试图利用任务之间的联系,利用过去的学习经验加速对于新任务的学习.机器学习各分支都已展开了对迁移学习的研究.本文综述了强化学习的迁移技术,依据认知心理学的理论将现有技术分为行为迁移和知识迁移两大类,并介绍、分析了各自的特点,并提出了一些开放性的问题.    

17.  基于Web的工程制图协同学习支持系统的研究与实现  被引次数:1
   吴欣  徐建成  沈钢《机械制造与自动化》,2002年第4期
   网络学习支持系统是实施网上协同学习的基础环境。本文讨论了一个基于WEB的工程制图协同学习支持系统 ,对其系统结构进行了介绍 ,并对支持整个系统的几个功能模块的主要技术特点和关键技术进行了研究和分析。    

18.  牙轮钻头金属端面密封表面强化技术研究进展  
   陈飞  陈家庆  杨英歌《新技术新工艺》,2009年第9期
   采用金属端面密封技术是牙轮钻头发展史上的一个里程碑,大大推动了钻井技术的进程。本文综述了目前牙轮钻头金属端面密封表面强化的方法,主要包括表面热处理强化、化学热处理强化、表面冶金强化和表面薄膜强化4大类,并介绍了几种金属端面密封表面强化新工艺。    

19.  一种基于启发式轮廓表的逻辑强化学习方法  
   刘全  高阳  陈道蓄  孙吉贵  姚望舒《计算机研究与发展》,2008年第45卷第11期
   强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.针对强化学习一直被"维数灾"问题所困扰的问题,提出在关系强化学习的基础上,引入启发式轮廓表的方法,采用含轮廓表的一阶谓词表示状态、活动和Q-函数,充分发挥Prolog表的优势,将逻辑谓词规则与强化学习相结合,形成一种新的逻辑强化学习方法--CCLORRL,并对其收敛性进行了证明.该方法使用轮廓形状谓词产生形状状态表,大幅度地减少状态空间;利用启发式规则指导动作的选择,减少了样本中不存在状态选择的盲目性.CCLORRL算法应用于俄罗斯方块中,实验表明,该方法是比较高效的.    

20.  从知识的表达和运用综述强化学习研究  被引次数:5
   陈宗海  杨志华  王海波  盛捷《控制与决策》,2008年第23卷第9期
   为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础--知识袭示和运用的角度对强化学习进行分类.并就经典随机强化学习、模糊强化学习、定性强化学习以及灰色强化学习作了较详细的探讨与比较.最后从知识表达和运用的角庹对强化学习的发展进行了展望.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号