摘 要: | 细粒度图像分类的主要挑战在于类间的高度相似性和类内的差异性.现有的研究多数基于深层的特征而忽略了浅层细节信息,然而深层的语义特征由于多次卷积和池化操作往往会丢失大量的细节信息.为了更好地整合浅层和深层的信息,提出了基于跨层协同注意和通道分组注意的细粒度图像分类方法.首先,通过ResNet50加载预训练模型作为骨干网络提取特征,由最后3个阶段提取的特征以3个分支的形式输出,每一个分支的特征通过跨层的方式与其余两个分支的特征计算协同注意并交互融合,其中最后一个阶段的特征经过通道分组注意模块以增强语义特征的学习能力.模型训练可以高效地以端到端的方式在没有边界框和注释的情况下进行训练,实验结果表明,该算法在3个常用细粒度图像数据集CUB-200-2011、Stanford Cars和FGVC-Aircraft上的准确率分别达到了89.5%、94.8%和 94.7%.
|