首页 | 本学科首页   官方微博 | 高级检索  
     

基于注意力反馈机制的深度图像标注模型
摘    要:针对图像标注任务提出了一种基于注意力反馈机制的深度图像标注模型。该模型采用编码器-解码器框架;编码器采用VGG-16的网络结构,以提取图像的特征信息;在解码器部分设计了一种堆叠方式自上而下的处理注意力信息,使网络的每一层都可以获得额外的特征信息。然后从生成的标注语句中提取特征,将关注特征和图像的关注区域结合,增强和图像关注区域的匹配性,使生成的标注语句近似真实语境。在Flickr8k、Flickr30k和MSCOCO等数据集进行实验,实验结果显示,所提出模型的识别率比经典图像识别模型高5%~9%。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号