基于多头类特定残差注意力和图卷积的多标签图像分类算法 |
| |
引用本文: | 龚亮威,宣士斌,李培杰,李然.基于多头类特定残差注意力和图卷积的多标签图像分类算法[J].微电子学与计算机,2023(8):45-54. |
| |
作者姓名: | 龚亮威 宣士斌 李培杰 李然 |
| |
作者单位: | 1. 广西民族大学电子信息学院;2. 广西民族大学人工智能学院 |
| |
基金项目: | 国家自然科学基金资助项目(61866003); |
| |
摘 要: | 针对ML-GCN中全局最大池化所获得的图像特征对特定类别在不同图像区域上缺乏针对性和丢失图像局部特征信息的问题,提出了类特定残差注意力(CSRA)模块.该模块可以有效捕获不同类别对象所占据的不同空间区域.此外,将提出的类特定残差注意力与图卷积神经网络相结合,提出了基于多头类特定残差注意力与图卷积的多标签图像分类算法(ML-CSRA).首先利用卷积神经网络提取通用的图像特征图,之后将提出的类特定残差注意力扩展为多头形式,并将其应用于通过卷积神经网络提取到的通用图像特征图,提取各个区域对应不同类别的特征.最后将图卷积神经网络提取的标签相关特征与多头类特定残差注意力提取的图像特征结合,得到最后的多标签图像分类结果.在MS-COCO 2014和VOC-2007数据集上的实验结果表明提出算法在所有评估指标上都优于目前已有算法.
|
关 键 词: | 多标签图像分类 残差注意力 标签相关性 图卷积神经网络 |
|
|