期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张碧陶庞振全《计算机工程与应用》2019,55(21):189-196

针对少量训练样本在深度学习算法中难以实现高精度分类的问题,提出一种融合强化学习和关系网络的小样本分类算法。采用图像预处理过程中基于强化学习的美学意识图像自动裁剪模型,通过构建美学意识奖励函数来输出最佳裁剪图像,从而保留图像最具特征部分。利用关系网络模型,将自动裁剪后的小样本图像中的训练样本图像与测试图像通过关系网络中的嵌入模块进行特征提取。将提取后的特征进行特征映射级联,并将级联后的特征映射馈送到关系网络中的关系模块中进行比较,将最终产生的0到1范围内的关系评分作为比较结果,从而判断测试图像所属的类别。在小样本数据集上进行实验并与现有方法进行对比,实验表明该方法能够实现较高精度的小样本分类。相似文献

2.

基于VAE和注意力机制的小样本图像分类方法

郑欣悦黄永辉《计算机应用与软件》2019,36(10)

小样本图像识别是人工智能中具有挑战性的新兴领域。传统的深度学习方法无法解决样本匮乏带来的问题,模型易出现过拟合导致训练效果不佳的情况。针对以上问题,提出结合表征学习和注意力机制的小样本学习方法。通过预训练VAE(Variational Auto-encoder)从任务中学习丰富的隐特征;对提取出的隐特征构建注意力机制,使得元学习器能快速地注意到对当前任务重要的特征;将注意力模块增强之后的特征使用分类器进行图像分类。实验表明,该算法在Mini-ImageNet和Omniglot数据集上达到72.5%和98.8%的准确率,显著优于现有元学习算法的性能。相似文献

3.

双分支注意力与FasterNet相融合的航拍场景分类

杨本臣曲业田金海波《计算机系统应用》2024,33(5):15-27

航拍高分辨率图像的场景类别多且类间相似度高,经典的基于深度学习的分类方法,由于在提取特征过程中会产生冗余浮点运算,运行效率较低, FasterNet通过部分卷积提高了运行效率但会降低模型的特征提取能力,从而降低模型的分类精度.针对上述问题,提出了一种融合FasterNet和注意力机制的混合结构分类方法.首先采用“十字型卷积模块”对场景特征进行部分提取,以提高模型运行效率.然后采用坐标注意力与通道注意力相融合的双分支注意力机制,以增强模型对于特征的提取能力.最后将“十字型卷积模块”与双分支注意力模块之间进行残差连接,使网络能训练到更多与任务相关的特征,从而在提高分类精度的同时,减小运行代价,提高运行效率.实验结果表明,与现有基于深度学习的分类模型相比,所提出的方法,推理时间短而且准确率高,参数量为19M,平均一张图像的推理时间为7.1 ms,在公开的数据集NWPU-RESISC45、EuroSAT、VArcGIS (10%)和VArcGIS (20%)的分类精度分别为96.12%、98.64%、95.42%和97.87%,与FasterNet相比分别提升了2.06%、0.77%、1.34... 相似文献

4.

小样本图像分类的注意力全关系网络

李晓旭刘忠源武继杰曹洁马占宇《计算机学报》2023,(2):371-384

传统的基于深度学习的图像分类方法在大样本分类任务中具有较好的分类效果,但在小样本分类任务中却存在较大的挑战,为此,小样本图像分类获得了研究人员的广泛关注.基于度量的方法是解决小样本图像分类的一种简单有效方法,它利用可学习的映射函数将分类任务中的所有样本映射到一个特征空间中,然后基于某种度量标准对查询特征进行分类.由于分类任务中不同类的两个图像有可能包含较多的相似性区域,导致特征空间中某些查询特征与异类的类原型特征的距离较近,较难学习到大的分类边界.为了解决上述问题,本文提出了注意力全关系网络(Total Relation Network with Attention,TRNA),该网络通过计算特征对的全关系和特征对的注意力来实现大边界的特征空间.具体地,在计算出所有的查询特征和类原型后,提出的网络利用特征对全关系拼接操作将特征空间中的任意两个特征在通道方向上进行拼接得到特征对矩阵,然后利用特征对注意力机制将特征对矩阵中不同类间难区分的特征对挑选出来并给予大的权重,最后将特征对矩阵输入卷积网络和全连接网络得到一个相似得分矩阵.实验结果表明本文的方法与关系网络相比,在数据集mini-Ima... 相似文献

5.

基于注意力机制和深度学习的钢板表面缺陷图像分类

江培营陶青川艾梦琴《计算机应用与软件》2021,38(9):214-219

针对当前国内钢板表面缺陷图像分类精度不高的问题,提出一种基于注意力机制改进Inception-ResnetV2模型的钢板表面缺陷图像分类方法.实验将六种不同类型的热轧钢板表面缺陷图像进行分类,为了更好地提取任务相关特征,在Inception-ResnetV2模型基础上嵌入CBAM注意力机制模块,该模块可以自主学习每个通道和空间特征的重要性,实现通道和空间上的特征重标定,提升图像分类的表现.实验结果表明,该算法相比于传统Inception-ResnetV2模型识别率提升了2.17百分点,收敛速度更快,具有极大的工程应用价值. 相似文献

6.

基于自适应三线性池化网络的细粒度图像分类

石进徐杨曹斌《计算机工程》2023,(5):239-246+254

细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空间更符合细粒度图像特性而具有一定的有效性,但忽略了层间的相互作用。针对细粒度图像识别领域存在的关键区域识别困难和层间交互关联弱的问题,融合二阶协方差通道注意力机制、自适应特征掩码与自适应三线性池化,提出自适应三线性池化网络ATP-Net,用于细粒度图像分类任务。通过二阶协方差通道注意力机制学习通道上的注意力向量,构建自适应特征掩码模块学习空间维上的注意力矩阵,设计自适应三线性池化模块学习特征的最终表示,以充分利用空间维、通道维上的信息。在CUB-200、Cars-196和Aircraft-100 3个细粒度图像分类数据集上的实验结果表明,ATP-Net的分类精度分别为89.30%、94.20%和91.80%。相似文献

7.

图神经网络的类别解耦小样本分类

邓戈龙黄国恒陈紫嫣《计算机工程与应用》2024,(2):129-136

现有的基于度量的小样本图像分类模型展现了一定的小样本学习性能,然而这些模型往往忽略了原始数据被分类关键特征的提取。图像数据中与分类无关的冗余信息被融入小样本模型的网络参数中,容易造成基于度量方法的小样本图像分类性能瓶颈。针对这个问题,提出一种基于图神经网络的类别解耦小样本图像分类模型（VT-GNN）,该模型结合图像自注意力与分类任务监督的变分自编码器作为图像嵌入模块,得到原始图像类别解耦特征信息,成为图结构中的一个图节点。通过一个多层感知机为节点之间构建具有度量信息的边特征,将一组小样本训练数据构造为图结构数据,借助图神经网络的消息传递机制实现小样本学习。在公开数据集Mini-Imagenet上,VT-GNN在分别5-way1-shot与5-way 5-shot设置中相较于基线图神经网络模型分别获得了17.9个百分点和16.25个百分点的性能提升。相似文献

8.

多注意力集成的图像检索

下载免费PDF全文

曾爱博陈优广《计算机工程与应用》2022,58(24):205-211

针对图像检索方法中二阶注意力模块使用全局特征之间的联系所生成的特征存在大量冗余信息,以及集成机制中各分支不能充分训练的问题,提出一种基于多注意力集成的图像检索方法。该方法利用在图像分类任务中表现良好的独立自注意力模块捕捉局部特征之间的联系,生成质量更高的特征以用于图像检索。该方法提出一个多注意力集成框架,在各注意力分支中分别利用独立自注意力模块产生相应的高效图像特征,并通过有效结合产生最终的图像特征。多注意力集成框架利用最终图像特征的排序损失、各注意力分支之间的差异损失及各分支的图像分类损失对模型进行联合训练,使各分支能得到充分训练。在CUB200-2011及CARS196图像检索数据集上的实验表明,所提方法可以有效提高检索精度。相似文献

9.

基于随机传播图卷积模型的零样本图像分类

下载免费PDF全文

芦楠楠刘一雄邱铭恺《图学学报》2022,43(4):624-631

零样本图像分类旨在识别训练时从未出现过的全新类别(未见类别),为此需要利用辅助信息建模未见类和可见类之间的关系。利用图卷积网络(GCN)进行零样本分类的模型可以借助知识图显式地表达类别之间的关系,但 GCN 易受过平滑影响,导致模型性能下降。针对此问题提出了基于随机传播图卷积模型的零样本图像分类方法。该方法使用随机传播机制处理原始特征以达到特征扰动和数据扩增的目的;利用数据中类别层级生成的知识图建模类别之间的语义关系。其中,图中节点代表类别,节点间的边代表类别之间的关系。再构建 GCN对处理后的特征进行训练,从节点中输出包含未见类别的分类器参数,进而实现零样本图像分类。实验结果表明,该方法可以有效地改善零样本图像分类中的时间消耗、分类精度和泛化性能。相似文献

10.

基于注意力机制和特征金字塔的孪生卷积神经网络目标跟踪算法

卞月楼陆振宇葛泉波郑成白延中《计算机应用与软件》2023,(2):178-185

为了解决目标跟踪过程中复杂场景下精度不高以及网络训练时正负样本不平衡的问题,提出一种结合注意力机制和特征金字塔的孪生卷积神经网络目标跟踪算法。该算法采用孪生卷积神经网络提取图像特征,并在特征提取过程中引入通道注意力机制,提升卷积特征的表征能力;利用特征金字塔模型对高低层卷积特征进行融合,将融合后的特征进行相似性学习;通过使用focal loss函数,来解决训练正负样本不平衡的问题。在OTB100和VOT2015数据集上对该算法进行实验验证与分析,结果表明,该算法精度和成功率都取得了较好的效果,具有较好的应用价值。相似文献

11.

基于注意力机制的弱监督细粒度图像分类

李文书王志骁李绅皓赵朋《计算机系统应用》2021,30(10):232-239

针对细粒度图像分类任务中难以对图中具有鉴别性对象进行有效学习的问题,本文提出了一种基于注意力机制的弱监督细粒度图像分类算法.该算法能有效定位和识别细粒度图像中语义敏感特征.首先在经典卷积神经网络的基础上通过线性融合特征得到对象整体信息的表达,然后通过视觉注意力机制进一步提取特征中具有鉴别性的细节部分,获得更完善的细粒度特征表达.所提算法实现了线性融合和注意力机制的结合,可看作是多网络分支合作训练共同优化的网络模型,从而让网络模型对整体信息和局部信息都有更好的表达能力.在3个公开可用的细粒度识别数据集上进行了验证,实验结果表明,所提方法有效性均优于基线方法,且达到了目前先进的分类水平. 相似文献

12.

基于尺度注意力网络的遥感图像场景分类

边小勇费雄君穆楠《计算机应用》2020,40(3):872-877

针对卷积神经网络（CNN）平等地对待输入图像中潜在的对象信息和背景信息,而遥感图像场景又存在许多小对象和背景复杂的问题,提出一种基于注意力机制和多尺度特征变换的尺度注意力网络模型。首先,开发一个快速有效的注意力模块,基于最优特征选择生成注意力图;然后,在ResNet50网络结构的基础上嵌入注意力图,增加多尺度特征融合层,并重新设计全连接层,构成尺度注意力网络;其次,利用预训练模型初始化尺度注意力网络,并使用训练集对模型进行微调;最后,利用微调后的尺度注意力网络对测试集进行分类预测。该方法在实验数据集AID上的分类准确率达到95.72%,与ArcNet方法相比分类准确率提高了2.62个百分点;在实验数据集NWPU-RESISC上分类准确率达到92.25%,与IORN方法相比分类准确率提高了0.95个百分点。实验结果表明,所提方法能够有效提高遥感图像场景分类准确率。相似文献

13.

融合注意力机制和高效网络的糖尿病视网膜病变识别与分类

下载免费PDF全文

张子振刘明朱德江《中国图象图形学报》2020,25(8):1708-1718

目的糖尿病视网膜病变（diabetic retinopathy,DR）是一种病发率和致盲率都很高的糖尿病并发症。临床中,由于视网膜图像不同等级之间差异性小以及临床医生经验的不同,会出现误诊、漏诊等情况,目前基于人工DR的诊断分类性能差且耗时费力。基于此,本文提出一种融合注意力机制（attention mechanism）和高效率网络（high-efficiency network,EfficientNet）的DR影像自动分类识别方法,以此达到对病变类型的精确诊断。方法针对实验中DR数据集存在的问题,进行剔除、去噪、扩增和归一化等处理;利用EfficientNet进行特征提取,采用迁移学习的策略用DR的数据集对EfficientNet进行学习与训练,提取深度特征。为了解决病变之间差异小的问题,防止网络对糖尿病视网膜图像的特征学习时出现错分等情况,在EfficientNet输出结果上加入注意力机制;根据网络提取的特征在深度分类器中进行分类,将视网膜图像按等级进行五分类。结果本文方法的分类精度、敏感性、特异性和二次加权（kappa）值分别为97.2%、95.6%、98.7%和0.84,具有较好的分类性能及鲁棒性。结论基于融合注意力机制的高效率网络（attention EfficientNet,A-EfficientNet）的DR分类算法有效地提高了DR筛查效率,解决了人工分类的手动提取特征的局限性,在临床上对医生诊断起到了辅助作用,能更有效地防治此类恶性眼疾造成严重视力损伤、甚至失明。相似文献

14.

结合注意力和改进样本选取方法的少样本高光谱分类孪生网络

杨宇新郭躬德王晖《计算机系统应用》2024,33(3):85-94

针对高光谱图像(hyperspectral image)样本人工标记困难导致的样本数量不足的问题, 本文提出了一个结合注意力和空间邻域的少样本孪生网络算法. 它首先对高光谱图像进行PCA预处理, 实现数据降维; 其次, 对模型训练样本采用间隔采样和边缘采样的方式进行选取, 以有效减少冗余信息; 之后, Siamese network以大小不同的patch形式进行两两结合, 构建出样本对作为训练集进行训练, 不仅实现了数据增强的效果, 还能在提取光谱信息特征的同时, 充分提取目标像素光谱信息以及其周围邻域空间信息; 最后, 添加光谱维度的注意力模块以及空间维度的相似度度量模块, 分别对光谱信息和空间邻域信息进行权重分布, 以达到提升分类性能的目的. 实验结果表明, 本文提出的方法在部分公开数据集上对比常用方法取得了较好的实验效果. 相似文献

15.

多尺度特征融合网络的视网膜OCT图像分类

下载免费PDF全文

韩璐毕晓君《智能系统学报》2022,17(2):360-367

目前基于深度学习的视网膜OCT图像分类方法存在网络特征提取能力低、小目标病变分类困难等问题。为此本文提出了一种双分支多尺度特征融合网络,通过加入门控注意力机制,利用深层特征作为选通信号传递给浅层特征,在消除冗余特征的同时,获得更细尺度的抽象信息。同时加入空洞空间金字塔模块,实现在不降低特征图分辨率的同时增大感受野,按不同比例有效捕获全局上下文信息,提高了小目标病变分类精度。实验结果表明,本文提出的方法在视网膜OCT图像分类任务中取得了较好效果,分类准确率达97.9%。相似文献

16.

基于改进动态ReLU和注意力机制模型的中药材粉末显微图像识别研究

王一丁姚毅李耀利蔡少青袁媛《计算机应用研究》2021,38(9):2861-2865,2870

中药材粉末显微特征图像数据量少、样本类别分布不均衡、类间差异小,传统的图像识别方法分类效果不佳.针对以上问题提出一种基于动态ReLU和注意力机制模型的深度卷积神经网络改进方法.首先,采用对小样本数据分类效果明显的Xception作为基础网络;其次,将网络中的静态ReLU激活函数替换为改进的动态ReLU函数,让每个样本具有自己独特的ReLU参数;最后,在网络中嵌入改进的SE模块,使网络能够更好地自动学习到每个特征通道的重要程度.以上方法可以使网络更加注重于图像中的细节信息,能很好地解决样本类别分布不均衡、类间差异小的问题.实验结果表明,对56种中药材粉末导管图像进行分类识别,其准确率提升了约1.5％,达到93.8％,证明了所提研究方法相比于其他图像分类方法具有一定的优越性. 相似文献

17.

融合渐进训练策略的logo图像分类

麻宇轩齐亚莉《计算机系统应用》2023,32(6):130-139

经济全球化赋予了logo巨大的商业价值,随着计算机视觉领域的发展,为logo分类与识别提供了更广阔的应用领域.本文针对logo图像的分类识别,为了提高模型对logo图像分类的能力,基于logo图像整体特征不显著且数量众多的特点,提出了用细粒度图像分类的方法渐进式多粒度拼图训练(progressive multi-granularity training of jigsaw patches, PMG-Net)对logo图像数据集进行分类.通过拼图生成器生成包含不同粒度信息的输入图像,再引入渐进式多粒度训练模块融合不同粒度的特征,融合后的特征更注重图像之间的细微差别,使logo图像分类的效果有显著提高.在提取输入图像特征时采用LeakyReLU (leaky rectified linear unit)激活函数保留图像中的负值特征信息,并引入通道注意力机制,调整特征通道的权重,增强特征信息指导能力以改进模型的分类效果.实验结果表明,本文在logo图像数据集上的分类精确率优于传统的分类方法.本文通过融合多粒度特征的渐进训练策略以及随机拼图生成器的方法实现了对logo图像的高效分类,为解决lo... 相似文献

18.

基于改进胶囊神经网络的遥感影像分类

冷浩柏卢涵宇郭彩袁咏仪杨文雅《计算机与现代化》2022,(2):102-107

针对遥感影像卷积神经网络（CNN）分类会导致特征信息丢失及泛化能力差的问题,提出一种基于通道注意力和混合注意力改进的胶囊神经网络分类模型。首先,为了胶囊神经网络能够适应于大尺寸输入图像,在特征提取模块中使用2个最大池化层;其次,为了提高分类精度,分别将SENet注意力和CBAM注意力加在特征提取模块的最后一层去改进特征提取模块;最后,将样本集随机地划分为训练集、验证集和测试集,进一步使用训练集和验证集训练模型,测试集测试模型,使用AID数据集对模型分类的泛化能力进行验证。实验结果表明:基于SENet网络改进的胶囊神经网络的准确率与Kappa系数要高于其他模型,泛化能力也优于其他模型,本文提出的模型的总体分类精度和泛化能力有了显著性提升,从而验证了本文方法的可行性和使用性。相似文献

19.

基于小样本学习融合随机深度和多尺度卷积的SDM-RNET网络

刘馨瑶梁军余嘉琳《计算机系统应用》2024,33(4):93-102

针对神经网络难以利用少量标注数据获取足够的信息来正确分类图像的问题,提出了一种融合随机深度网络和多尺度卷积的关系网络——SDM-RNET.首先在模型嵌入模块引入随机深度网络用于加深模型深度,然后在特征提取阶段采用多尺度深度可分离卷积替代普通卷积进行特征融合,经过骨干网络后再采用深浅层特征融合获取更丰富的图像特征,最终学习预测出图像的类别.在mini-ImageNet、RP2K、Omniglot这3个数据集上对比该方法与其他小样本图像分类方法,结果表明在5-way 1-shot和5-way 5-shot分类任务上该方法准确率最高. 相似文献