首页 | 本学科首页   官方微博 | 高级检索  
     

基于对象关系网状转换器的图像描述模型
引用本文:李雅红,周海英,徐少伟. 基于对象关系网状转换器的图像描述模型[J]. 计算机工程, 2021, 47(5): 197-204. DOI: 10.19678/j.issn.1000-3428.0059517
作者姓名:李雅红  周海英  徐少伟
作者单位:中北大学 大数据学院, 太原 030051
摘    要:针对图像描述生成模型缺乏空间关系信息且图像特征利用不充分的问题,结合对象关系网状转换器,提出一种改进的图像描述模型.利用Faster R-CNN提取图像的外观和边界框特征,并将提取的特征输入到改进的转换器中经过编解码生成图像描述.通过将对象外观和边界框特征合并为关系特征的方式对编码器自我注意力层的注意力权值进行改进,以...

关 键 词:图像描述模型  注意力机制  编码器和解码器  对象关系  网状转换器
收稿时间:2020-09-14
修稿时间:2020-11-08

Image Description Model Based on Object Relation Mesh Transformer
LI Yahong,ZHOU Haiying,XU Shaowei. Image Description Model Based on Object Relation Mesh Transformer[J]. Computer Engineering, 2021, 47(5): 197-204. DOI: 10.19678/j.issn.1000-3428.0059517
Authors:LI Yahong  ZHOU Haiying  XU Shaowei
Affiliation:School of Data Science and Technology, North University of China, Taiyuan 030051, China
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号