基于注意力反馈机制的深度图像标注模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于注意力反馈机制的深度图像标注模型

摘要：	针对图像标注任务提出了一种基于注意力反馈机制的深度图像标注模型。该模型采用编码器-解码器框架;编码器采用VGG-16的网络结构,以提取图像的特征信息;在解码器部分设计了一种堆叠方式自上而下的处理注意力信息,使网络的每一层都可以获得额外的特征信息。然后从生成的标注语句中提取特征,将关注特征和图像的关注区域结合,增强和图像关注区域的匹配性,使生成的标注语句近似真实语境。在Flickr8k、Flickr30k和MSCOCO等数据集进行实验,实验结果显示,所提出模型的识别率比经典图像识别模型高5%～9%。
本文献已被 CNKI 等数据库收录！