细粒度鱼类疫病图像识别算法模型 |
| |
引用本文: | 魏立明,赵奎,王宁,张忠岩,崔海朋.细粒度鱼类疫病图像识别算法模型[J].激光与光电子学进展,2023(16):119-128. |
| |
作者姓名: | 魏立明 赵奎 王宁 张忠岩 崔海朋 |
| |
作者单位: | 1. 中国海洋大学信息科学与工程学部;2. 青岛杰瑞工控技术有限公司 |
| |
基金项目: | 山东省重点研发计划(科技示范工程)(2021SFGC0701); |
| |
摘 要: | 通过肉眼识别鱼类疫病依赖于诊断人员的经验,疫病数据存在类间差距较小与识别效率低等细粒度问题。由于Transformer缺乏卷积神经网络(CNN)的归纳偏差,需要大量的数据进行训练;CNN对全局特征提取不足,泛化性能较差等问题限制模型的分类精度。基于特征图对所有像素的全局交互建立算法模型,提出一种基于CNN与Vision Transformer相结合的鱼类疫病识别模型(CViT-FDRM)。首先,搭建鱼类疫病的数据库FishData01;其次,利用CNN提取鱼类图像细粒度特征,采用Transformer模型自注意力机制获取图像全局信息进行并行训练;然后,采用组归一化层将样本通道分组求均值与标准差;最后,采用404张鱼类疫病图像进行测试,CViT-FDRM达到97.02%的识别准确率。在细粒度图像开源数据库Oxford Flowers上的实验结果表明,CViT-FDRM的分类精度优于主流的细粒度图像分类算法,可达95.42%,提高4.84个百分点。CViT-FDRM在细粒度图像识别方面可达到较好的效果。
|
关 键 词: | 图像处理 卷积神经网络 Vision Transformer 细粒度 鱼类疫病识别 CViT-FDRM |
|
|