基于改进Transformer的细粒度图像分类模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于改进Transformer的细粒度图像分类模型

引用本文：	田战胜,刘立波.基于改进Transformer的细粒度图像分类模型[J].激光与光电子学进展,2023(2):171-178.

作者姓名：	田战胜刘立波

作者单位：	宁夏大学信息工程学院

基金项目：	宁夏自然科学基金（2020AAC03031）；;国家自然科学基金（61862050）；

摘要：	细粒度图像具有不同子类间差异小、相同子类内差异大的特点。现有网络模型在处理过程中存在特征提取能力不足、特征表示冗余和归纳偏置能力弱等问题，因此提出一种改进的Transformer图像分类模型。首先，利用外部注意力取代原Transformer模型中的自注意力，通过捕获样本间相关性提升模型的特征提取能力；其次，引入特征选择模块筛选区分性特征，去除冗余信息，加强特征表示能力；最后，引入融合的多元损失，增强模型归纳偏置和区分不同子类、归并相同子类的能力。实验结果表明，所提方法在CUB-200-2011、Stanford Dogs和Stanford Cars三个细粒度图像数据集上的分类精度分别达89.8%、90.2%和94.7%，优于多个主流的细粒度图像分类方法，分类结果较好。
关键词：	细粒度图像分类 Transformer 外部注意力特征选择多元损失