首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
针对图像美感度分类中出现的准确率低、美感特征描述差等问题,提出了一种基于深层卷积神经网络的图像美感度分类算法.首先将图片输入55层卷积神经网络自动学习并获得更加细致和深层次的美感特征,然后通过softmax分类器进行图像美感度分类,从而得到最优的分类结果.将该算法与多种传统算法和浅层深度卷积神经网络的算法进行对比实验,结果表明该算法在A1和A0数据库的准确率分别达到80.13%和87.32%,且在CUHKPQ数据库的6种场景下,获得了更好的分类准确率.  相似文献   

2.
针对现有频谱分离方法进行声学场景分类研究时其分类准确率不高的问题,提出了一种基于梅尔频谱分离和长距离自校正卷积神经网络(long-distance self-calibration convolutional neural network, LSCNet)的声学场景分类方法。首先,介绍了频谱的谐波打击源分离原理,提出了一种梅尔频谱分离算法,将梅尔频谱分离出谐波分量、打击源分量和残差分量;然后,结合自校正神经网络和残差增强机制,提出了一种长距离自校正卷积神经网络;该模型采用频域自校正算法以及长距离增强机制来保留特征图原始信息,通过残差增强机制和通道注意力增强机制加强了深层特征与浅层特征间的关联度,且结合多尺度特征融合模块,以进一步提取模型训练中输出层的有效信息,从而提高模型的分类准确率;最后,基于Urbansound8K和ESC-50数据集开展了声学场景分类实验。实验结果表明:梅尔频谱的残差分量能够针对性地减少背景噪音的影响,从而具有更好的分类性能,且LSCNet实现了对特征图中频域信息的关注,其最佳分类准确率分别达到90.1%和88%,验证了该方法的有效性。  相似文献   

3.
针对乳腺癌病理图像的自动分类问题,提出基于深度学习的分类算法. 通道重校准模型是作用于特征通道的注意力模型,可以利用学习到的通道权重对无用特征进行抑制来实现对特征通道的重校准,以达到更高的分类准确率. 为了使通道重校准的结果更加准确,提出多尺度通道重校准模型,设计卷积神经网络 msSE-ResNet. 多尺度特征通过网络中的最大池化层获得并作为后续通道重校准模型的输入,将不同尺度下学到的通道权重进行融合,可以改善通道重校准的结果. 该实验在公开数据集BreaKHis上开展. 实验结果表明,该网络对良性/恶性乳腺病理图像分类任务达到88.87%的分类精度,可以对不同放大倍数下获取的病理图像具有较好的鲁棒性.  相似文献   

4.
为了解决乳腺病理图像分类准确率低,耗时费力的问题,本文提出了利用卷积神经网络(CNN)对乳腺病理图像进行分类的方法.利用该方法将病理图像快速、自动划分为良性和恶性2类.采用基于Inceptionv3架构的卷积神经网络模型和迁移学习算法进行病理图像特征提取;利用全连接层神经网络和SoftMax函数进行图像分类.同时针对高...  相似文献   

5.
卫星图像实现星际对地观测并被广泛的应用到了军事和经济生活领域。受到星载成像设备和星地通讯带宽的限制,卫星图像的地面分辨率常不能完全满足目标识别与分析的需求。卫星图像的成像幅度宽且范围广,地面目标的尺度变化大、纹理信息多样化,给现有图像超分辨率技术带来了新的挑战。针对卫星图像的多尺度特性,提出了一种多尺度残差深度神经网络,首先提取低分辨率卫星图像的多尺度特征,对不同尺度特征建立自适应深度神经网络,然后使用融合网络进行残差融合,融合不同尺度高频信息,最终生成高分辨卫星图像。在Space Net卫星图像数据集中的实验结果证明了本文算法的优越性。  相似文献   

6.
为了提升交通标志自动识别的精度,提出一种基于多尺度CNN的交通标志识别方法(TSR -MSCNN算法).该方法采用三阶段卷积神经网络,融合了低阶、中阶和高阶3种不同尺度的特征,并串联了多个小卷积层用以代替单个较大卷积层.通过对全连接层的神经元个数、Dropout参数、卷积核尺寸等网络超参数进行选比实验,获得了最佳的网络超参数.利用德国交通标志基准数据库(GTSRB)对不同算法进行测试表明,本文提出的算法在较小的网络参数量下能够有效提取交通标志特征,获取的识别准确率达到99.76%,且显著优于传统卷积神经网络方法和多尺度特征方法的识别准确率,因此本文算法在图像识别领域有良好的应用价值.  相似文献   

7.
为了改善低层特征对图像内容描述不够精确而导致现勘图像分类准确率低的问题,提出一种利用深度学习特征的改进局部约束线性编码(local-constrained linear coding,LLC)算法。采用滑动窗口法提取图像密集卷积神经网络(convolutional neural networks,CNN)特征;利用近似LLC算法对提取的密集CNN特征进行快速编码和最大池化,并采用多尺度空间金字塔匹配产生包含空间位置信息的稀疏编码特征。最后,利用支持向量机对现勘图像进行分类从而得到高效的图像特征。对比实验结果表明,该算法的分类准确率较高。  相似文献   

8.
为解决单目图像中冗余像素点不利于深度神经网络快速完成深度信息检测的问题,提出一种基于卷积神经网络的深度线段分类算法。对NYU-Depth数据集使用线段检测算法进行线段检测得到原始图像的线段特征图,通过数据预处理结合深度数据得到表征深度信息的线段集合及其标签,提出适用于线段特征的卷积神经网络,实现单目图像中深度线段的分类。通过在不同线段数目上进行多次多组对比试验,深度线段分类准确率达到73.50%。试验结果证明了利用卷积神经网络实现深度线段分类的可实施性,有助于更好的利用图像几何特征解决深度估计问题。  相似文献   

9.
为了捕获国画图像的局部表现手法而实现风格分类,提出一种基于多尺度卷积神经网络(Convolutional Neural Network,CNN)特征的国画图像分类算法.该算法先对AlexNet网络模型进行改进,得到精简AlexNet网络模型以降低网络深度与参数规模.然后采用非对称空间分块方法对训练样本进行数据扩充,训练...  相似文献   

10.
为代替人工对4C巡检车拍摄铁路接触网图像进行分析,使检测的速度和准确率达到实用的要求,本文提出一种基于改进YOLO V3的接触网绝缘子检测方法。该方法在YOLO V3的网络结构Darknet-53的第二个残差块和第三个残差块中间再增加一个新的对小目标友好的4倍降采样的残差块,提高对小目标的检测准确率。并根据相似图像中绝缘子的位置大体相同的特点,通过感知哈希算法分类图像,对同类图像采用候选区域扫描策略加快检测速度。实验结果表明改进后的方法对绝缘子检测的准确率从93.6%提升至99.2%,同类图像的检测速度提升了46%。  相似文献   

11.
针对血细胞图像中白细胞样本较少和生成细胞图像细节不清晰,导致检测精度较低的问题,提出基于多尺度鉴别器的条件生成对抗网络. 该网络通过生成并添加大量逼真的白细胞图像到分类检测网络训练集的方式,实现对血细胞图像的生成和分类检测. 在现有条件生成对抗网络真假鉴别器中,引入多尺度卷积核、池化域并在通道上拼接,提升鉴别器对微观细节纹理特征和宏观几何特征的鉴别能力;引入梯度相似性损失函数,以提高生成细胞图像的亮度及边缘清晰度,提升图像的真实感. 实验证明,在图像生成阶段,增加多尺度鉴别器和梯度相似性损失函数提高了生成细胞图像的质量;在图像分类检测阶段,对比仅有真实数据训练的情况,增加细胞样本多样性使细胞分类检测的平均精度由90.4%提升至94.7%.  相似文献   

12.

基于多尺度空洞卷积神经网络的高光谱图像分类

郑姗姗1,刘文1,单锐1,赵静一2,江国乾3,张智4

(1. 燕山大学理学院,河北 秦皇岛 066004;2. 燕山大学机械工程学院,河北 秦皇岛 066004;3. 燕山大学电气工程学院,河北 秦皇岛 066004;4. 北京航天研究所,北京 100094)

创新点说明:

1)将图像分割方法——空洞卷积用于卷积神经网络进行高光谱图像分类,提取更加广泛、抽象的图像特征。

2)构建基于多尺度空洞卷积神经网络的高光谱图像分类方法。搭建多尺度聚合结构,在每个通道中使用快捷连接和空洞卷积结构,有效提取图像特征,避免信息丢失。

研究目的:

针对图像信息丢失问题,得到高精度的高光谱图像分类方法。

研究方法:

在Indian Pines和Pavia University数据集上,与4个已有的高光谱图像分类方法进行对比实验,比较OA, AA和Kappa值。

研究结果:

多尺度空洞卷积神经网络在Indian Pines和Pavia University数据集上OA值分别达到了99.58%,99.92%。AA值分别达到了99.57%,99.90%。Kappa分别达到了99.52%,99.89%。

结论:

1)在卷积神经网络中引入空洞卷积,可以有效避免图像信息丢失。

2)多尺度空洞卷积神经网络能提取更佳的判别性特征,实现高分类性能。

关键词:多尺度聚合;空洞卷积;高光谱图像分类;快捷连接

  相似文献   

13.
一种多尺度嵌套卷积神经网络模型   总被引:1,自引:0,他引:1  
卷积神经网络模型要求训练图像与测试图像在空间尺度上一致.为弱化这一限制,对卷积层特征提取器进行多尺度改进,提出了一种尺度不变卷积神经网络模型,以自动适应输入图像在平面空间上的尺度变化.同时,将多层Maxout网络嵌入新模型中,以进一步提高特征提取能力,提高图像识别与分类的准确性.实验测试结果表明,该模型提高了传统卷积神经网络模型的尺度不变性和分类精度.  相似文献   

14.
针对传统神经网络仅利用端层特征进行分类导致特征不全面,以及交通标志识别中计算量大、时间长等问题,提出基于多层特征表达和极限学习机的交通标志识别方法。利用CNN网络提取多层交通标志特征图;采用多尺度池化操作,将提取出的各层特征向量联合形成一个具有多尺度多属性特征的交通标志特征向量;使用极限学习机分类器准确快速地实现交通标志的识别。实验结果表明,该方法能有效地提高交通标志识别的准确率,且具有较好的泛化能力和实时性。  相似文献   

15.
With the development of sensors, the application of multi-source remote sensing data has been widely concerned. Since hyperspectral image (HSI) contains rich spectral information while light detection and ranging (LiDAR) data contains elevation information, joint use of them for ground object classification can yield positive results, especially by building deep networks. Fortunately, multi-scale deep networks allow to expand the receptive fields of convolution without causing the computational and training problems associated with simply adding more network layers. In this work, a multi-scale feature fusion network is proposed for the joint classification of HSI and LiDAR data. First, we design a multi-scale spatial feature extraction module with cross-channel connections, by which spatial information of HSI data and elevation information of LiDAR data are extracted and fused. In addition, a multi-scale spectral feature extraction module is employed to extract the multi-scale spectral features of HSI data. Finally, joint multi-scale features are obtained by weighting and concatenation operations and then fed into the classifier. To verify the effectiveness of the proposed network, experiments are carried out on the MUUFL Gulfport and Trento datasets. The experimental results demonstrate that the classification performance of the proposed method is superior to that of other state-of-the-art methods.  相似文献   

16.
针对现有的垃圾图像分类模型实时性能差和分类精度低的问题,提出基于改进MobileNet v2的垃圾图像分类方法,构建以MobileNet v2为核心的轻量级特征提取网络. 通过调整宽度因子降低模型的参数量;在模型中嵌入通道和空间注意力模块,增强网络对特征的细化能力;设计多尺度特征融合结构,增强网络对尺度的适应性;利用迁移学习的方式优化模型参数,进一步提高模型精度. 实验结果表明,算法在自建数据集上的平均准确率为94.6%,分别高于MobileNet v2、VGG16、GoogleNet、ResNet50、ResNet101模型2.0%、3.4%、3.2%、2.3%、1.2%;所提算法在2种公共图像分类数据集CIFAR-100和tiny-ImageNet中均取得不错表现;模型参数量仅为0.83 M,体积约为基础模型的2/5,在边缘设备JETSON TX2上的单次推理耗时68 ms,实现了推理速度和预测准确率的提升.  相似文献   

17.
针对使用人工设计特征训练的行人检测算法准确率和效率较低的问题,提出一种采用卷积神经网络特征图聚集多尺度行人检测高效算法. 设计一种特征图聚集网络,将高层次特征图与低层次特征图进行聚集,构造出有较好空间分辨和语义能力的特征图;构造特征延伸网络,提供用于多尺度行人检测的特征图;重新设计目标候选区域,构造多尺度行人检测网络,提升定位准确性,并将特征图聚集网络、特征延伸网络和多尺度行人检测网络组合进行端到端训练. 实验测试结果表明,该算法可以有效提高行人检测与定位准确性,并可在普通硬件设备条件下提供实时检测.  相似文献   

18.
近来,视觉Transformer (vision transformer, ViT)在图像识别领域取得突破性进展,其自我注意力机制(self-attention mechanism, MSA)能够提取不同像素块的判别性标记信息进而提升图像分类精度,但其深层中的分类标记容易忽略层级之间的局部特征,此外,嵌入层将固定大小的像素块输入网络,不可避免地引入额外的图像噪声。为此,本文研究了一种基于数据增强的视觉 Transformer(data augmentation vision transformer, DAVT),并提出注意力裁剪的数据增强方法,以注意力权重为指导裁剪图像,提高网络学习关键特征的能力。其次,本文还提出层级注意力选择方法(hierarchical attention selection, HAS),它通过对层级之间标记进行筛选并融合,提升网络学习层级之间判别性标记的能力。实验结果表明,该方法在CUB-200-2011和Stanford Dogs两个通用数据集上的准确率优于现有的主流方法,其准确率比原始ViT分别提高1.4%和1.6%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号