首页 | 本学科首页   官方微博 | 高级检索  
     

深度分层强化学习研究与发展
引用本文:黄志刚,刘全,张立华,曹家庆,朱斐.深度分层强化学习研究与发展[J].软件学报,2023,34(2):733-760.
作者姓名:黄志刚  刘全  张立华  曹家庆  朱斐
作者单位:苏州大学 计算机科学与技术学院, 江苏 苏州 215006;苏州大学 计算机科学与技术学院, 江苏 苏州 215006;江苏省计算机信息处理技术重点实验室(苏州大学), 江苏 苏州 215006;符号计算与知识工程教育部重点实验室(吉林大学), 吉林 长春 130012;软件新技术与产业化协同创新中心(南京), 江苏 南京 210093
基金项目:国家自然科学基金(61772355,61702055,61876217,62176175);江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18,93K172021K08);苏州市应用基础研究计划工业部分(SYG201422);江苏高校优势学科建设工程资助项目
摘    要:深度分层强化学习是深度强化学习领域的一个重要研究方向,它重点关注经典深度强化学习难以解决的稀疏奖励、顺序决策和弱迁移能力等问题.其核心思想在于:根据分层思想构建具有多层结构的强化学习策略,运用时序抽象表达方法组合时间细粒度的下层动作,学习时间粗粒度的、有语义的上层动作,将复杂问题分解为数个简单问题进行求解.近年来,随着研究的深入,深度分层强化学习方法已经取得了实质性的突破,且被应用于视觉导航、自然语言处理、推荐系统和视频描述生成等生活领域.首先介绍了分层强化学习的理论基础;然后描述了深度分层强化学习的核心技术,包括分层抽象技术和常用实验环境;详细分析了基于技能的深度分层强化学习框架和基于子目标的深度分层强化学习框架,对比了各类算法的研究现状和发展趋势;接下来介绍了深度分层强化学习在多个现实生活领域中的应用;最后,对深度分层强化学习进行了展望和总结.

关 键 词:人工智能  强化学习  深度强化学习  半马尔可夫决策过程  深度分层强化学习
收稿时间:2021/8/2 0:00:00
修稿时间:2022/3/30 0:00:00

Research and Development on Deep Hierarchical Reinforcement Learning
HUANG Zhi-Gang,LIU Quan,ZHANG Li-Hu,CAO Jia-Qing,ZHU Fei.Research and Development on Deep Hierarchical Reinforcement Learning[J].Journal of Software,2023,34(2):733-760.
Authors:HUANG Zhi-Gang  LIU Quan  ZHANG Li-Hu  CAO Jia-Qing  ZHU Fei
Affiliation:School of Computer Science and Technology, Soochow University, Suzhou 215006, China;School of Computer Science and Technology, Soochow University, Suzhou 215006, China;Jiangsu Key Laboratory for Computer Information Processing Technology (Soochow University), Suzhou 215006, China;Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education (Jilin University), Changchun 130012, China;Collaborative Innovation Center of Novel Software Technology and Industrialization (Nanjing), Nanjing 210093, China
Abstract:
Keywords:artificial intelligence  reinforcement learning  deep reinforcement learning  semi-Markov decision process  deep hierarchical reinforcement learning
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号