基于改进Transformer的细粒度图像分类模型 |
| |
引用本文: | 田战胜,刘立波.基于改进Transformer的细粒度图像分类模型[J].激光与光电子学进展,2023(2):171-178. |
| |
作者姓名: | 田战胜 刘立波 |
| |
作者单位: | 宁夏大学信息工程学院 |
| |
基金项目: | 宁夏自然科学基金(2020AAC03031);;国家自然科学基金(61862050); |
| |
摘 要: | 细粒度图像具有不同子类间差异小、相同子类内差异大的特点。现有网络模型在处理过程中存在特征提取能力不足、特征表示冗余和归纳偏置能力弱等问题,因此提出一种改进的Transformer图像分类模型。首先,利用外部注意力取代原Transformer模型中的自注意力,通过捕获样本间相关性提升模型的特征提取能力;其次,引入特征选择模块筛选区分性特征,去除冗余信息,加强特征表示能力;最后,引入融合的多元损失,增强模型归纳偏置和区分不同子类、归并相同子类的能力。实验结果表明,所提方法在CUB-200-2011、Stanford Dogs和Stanford Cars三个细粒度图像数据集上的分类精度分别达89.8%、90.2%和94.7%,优于多个主流的细粒度图像分类方法,分类结果较好。
|
关 键 词: | 细粒度图像分类 Transformer 外部注意力 特征选择 多元损失 |
|