首页 | 本学科首页   官方微博 | 高级检索  
     

深度神经网络图像描述综述
引用本文:许昊,张凯,田英杰,种法广,王子超.深度神经网络图像描述综述[J].计算机工程与应用,2021,57(9):9-22.
作者姓名:许昊  张凯  田英杰  种法广  王子超
作者单位:1.上海电力大学 计算机科学与技术学院,上海 201300 2.国家电网公司 上海电器科学研究院,上海 200437
基金项目:上海高校青年教师培养资助计划;国家自然科学基金
摘    要:深度学习的迅速发展使得图像描述效果得到显著提升,针对基于深度神经网络的图像描述方法及其研究现状进行详细综述。图像描述算法结合计算机视觉和自然语言处理的知识,根据图像中检测到的内容自动生成自然语言描述,是场景理解的重要部分。图像描述任务中,一般采用由编码器和解码器组成的基本架构。改进编码器或解码器,应用生成对抗网络、强化学习、无监督学习以及图卷积神经网络等方法能有效提高图像描述算法的性能。对每类方法的代表模型算法的效果以及优缺点进行分析,并介绍适用的公开数据集,在此基础上进行对比实验。对图像描述面临的挑战以及未来工作的发展方向做出展望。

关 键 词:深度神经网络  计算机视觉  图像描述  编码器-解码器架构  注意力机制  

Review of Deep Neural Network-Based Image Caption
XU Hao,ZHANG Kai,TIAN Yingjie,CHONG Faguang,WANG Zichao.Review of Deep Neural Network-Based Image Caption[J].Computer Engineering and Applications,2021,57(9):9-22.
Authors:XU Hao  ZHANG Kai  TIAN Yingjie  CHONG Faguang  WANG Zichao
Affiliation:1.College of Computer Science and Technology, Shanghai University of Electric Power, Shanghai 201300, China 2.Shanghai Electrical Research Institute, State Grid Corporation of China, Shanghai 200437, China
Abstract:
Keywords:deep neural network  computer vision  image caption  encoder-decoder architecture  attention mechanism  
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号