首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了捕获国画图像的局部表现手法而实现风格分类,提出一种基于多尺度卷积神经网络(Convolutional Neural Network, CNN)特征的国画图像分类算法。该算法先对AlexNet网络模型进行改进,得到精简AlexNet网络模型以降低网络深度与参数规模。然后采用非对称空间分块方法对训练样本进行数据扩充,训练具有特征提取能力的CNN网络模型,以提取国画图像的多尺度CNN特征。最后,采用前向搜索选择方法对多尺度CNN特征进行选择降维,再结合支持向量机(Support Vector Machine, SVM)分类器实现国画图像自动分类。对比实验结果表明,多尺度CNN特征较之全局CNN特征分类精度提高了2.12%,且所提算法在分类精度方面均高于其他图像分类方法。  相似文献   

2.
为了提高手写体数字的识别率,在AlexNet网络模型的基础上进行改进,引入Inception-resnet模块替换模型中的Conv3和Conv4来提升模型的特征提取能力;使用批归一化处理(BN)方法加快网络的收敛速度,防止过拟合;减少卷积核的数量,提升网络的训练速度。在MNIST数据集上进行训练与测试,实验结果表明改进的网络模型具有较高的检测精度,达到了0.9966,证明了本算法的有效性。  相似文献   

3.
针对较小数据集识别时的过拟合和误差传递问题,提出了一种基于卷积神经网络的常见人体动作识别方法.该方法首先利用经典雷达信号处理方法对人体动作回波进行预处理,生成人体动作的时频图像;然后构建卷积神经网络(CNN),并以时频图作为CNN输入数据对网络参数进行训练;最后利用网络公开数据集对所提方法进行了实验验证.实验结果表明,构建的CNN能够准确识别4类不同的人体动作,准确率不低于97%.  相似文献   

4.
针对通信辐射源个体开集识别问题,提出一种基于卷积原型网络的辐射源个体开集识别方法。将接收到的信号进行信噪比估计并处理为灰度矢量图输入至卷积原型网络计算出特征点。分析不同损失函数和判决准则,选取三维原型的特征提取层、DCE作为损失函数、DR作为判决准则的开集识别模型。对该方法进行了仿真实验,结果表明,该方法在开集识别场景下比传统CNN预测概率更有优势,归一化准确率提升约20%,证明该方法的有效性。  相似文献   

5.
一维卷积神经网络实时抗噪故障诊断算法   总被引:3,自引:0,他引:3  
针对旋转机械智能诊断方法计算量大和抗噪能力差的问题,在经典模型LeNet-5的基础上提出基于一维卷积神经网络的故障诊断算法.采用全局平均池化层代替传统卷积神经网络中的全连接层,在降低模型计算量的同时,降低模型参数数量和过拟合的风险;利用随机破坏后的时域信号进行训练以提高其抗噪能力;采用改进后的一维卷积核和池化核直接作用于原始时域信号,将特征提取和故障分类合二为一,通过交替的卷积层和池化层实现原始信号自适应特征提取,结合全局平均池化层完成故障分类.利用轴承数据和齿轮数据进行实验验证并对比经典模型LeNet-5、BP神经网络和SVM.结果表明:采用全局平均池化层可有效降低模型计算量,提高模型在低信噪比条件下的诊断精度,采用随机破坏输入训练策略可显著提升模型的抗噪诊断能力;改进后的模型可以实现噪声环境下准确、快速和稳定的故障诊断.通过t-SNE可视化分析说明了模型在特征学习上的有效性.  相似文献   

6.
基于一维心电信号,提出了一种改进的卷积双向长短时记忆网络以实现心律失常的自动分类。基于卷积神经网络(CNN)及其注意力机制提取关键特征,搭建双向长短时记忆网络(BiLSTM)挖掘心电信号的时间相关性,最终实现心电信号的自动分类。在MIT-BIH心律失常数据集上进行的实验结果表明,该方法在获得总体精度99.32%的基础上,实现了稀有类别分类的提升,其S与F类分类精确度分别提升了1.02%和10.07%,召回率分别提升了12.52%和4.25%,满足心律失常自动分类的检测要求。  相似文献   

7.
基于改进稀疏滤波与深度网络融合的轴承故障诊断   总被引:1,自引:0,他引:1  
针对滚动轴承故障时特征提取依赖人工经验,以及故障类别难以自动准确识别的问题,提出了一种改进稀疏滤波和深层空洞门卷积网络相结合的故障诊断模型. 采用滑动窗对具有时序特征的轴承振动信号进行采样处理以避免过拟合;通过改进目标函数的稀疏滤波消除数据中的异方差并提取数据特征,达到缩短计算时间和提高分类准确率的效果;利用空洞门卷积和双向LSTM网络对噪声进行滤除,同时进行故障分类识别. 对比凯斯西储大学和动力系统装置的轴承实验数据,显示该模型故障诊断准确率可达98%. 不同负载和不同信噪比的轴承振动信号实验,表明该模型具有泛化性和抗噪性.  相似文献   

8.
针对典型卷积神经网络卷积核由经验设置且网络结构固定不变难以后期再学习的问题,基于稀疏自编码器(Sparse Autoencoder, SAE)和卷积神经网络(Convoutional Neural Network, CNN),提出新的CNN模型。该模型通过SAE预训练CNN网络的卷积核,提取有效特征;并在典型CNN结构基础上增加一条网络支路,使得后续再学习时只更新支路权值,记忆已有特征并增加新特征。文中模型在MNIST数据集上迭代更新10次网络权值可以使测试识别率达到97.65%;在手写汉字数据集HCL2000中的简单字,中等字,复杂字及相似字上的测试正确率能达93%以上;50个训练样本,250个测试样本时,相似字识别率可达80.36%;比典型CNN及传统手写汉字识别方法更具泛化性。实验表明所提出方法可有效应用于手写字等图像识别应用中。  相似文献   

9.
针对卷积神经网络(Convolutional neural network,CNN)模型在对工业数值型数据分类方面存在特征使用不充分、模型分类性能不佳等问题,提出了一种基于自适应卷积核的改进CNN(Improved CNN based on adaptive convolution kernel, ACK-ICNN)算法。该算法为了增加特征的重复使用率,构建了一种多尺度卷积核的模型结构,通过融合处理卷积核提取的不同特征来实现,增强了模型的适应能力;为了进一步提升该算法的性能,利用网格搜索算法自适应选取CNN中最优的卷积核大小,使得模型能够提取出最优的特征。采用TE过程的故障数据对其进行测试,并与支持向量机、极限学习机、最近邻等典型的数据驱动方法进行对比,测试结果表明,该算法能有效提升各类故障的分类精度。  相似文献   

10.
由于医学病理图像标注成本高、获取困难,采用数据增强方法对小样本数据集进行扩充。针对传统分类方法对特征工程过度依赖的问题,采用以AlexNet为架构的卷积网络对良性、恶性肿瘤进行全自动分类。为了解决AlexNet网络中间层改变原始数据分布的问题,引入批量归一化算法以减小网络中间层产生的偏移量,加速网络收敛,提高分类准确率。同时采用Dropout避免过拟合。实验结果表明,改进后的AlexNet网络分类准确率较原方法提高了6.09%,具有较好的鲁棒性和泛化性。  相似文献   

11.
通过与传统神经网络对比,分析了利用卷积神经网络(CNN)进行车牌号图像识别中的特征提取过程,提出了优化卷积和池化的过程来提高算法的收敛速度和准确率。运用Py Charm环境建立了改进后的车牌号识别模型,并通过实验验证了其正确性与识别速度。通过BP神经网络、传统Le Net-5 CNN和改进后的CNN对相同的字符集进行对比分析实验,得出了改进后的CNN模型的优势。  相似文献   

12.
针对卷积核随机初始化以及梯度下降法训练卷积神经网络易陷入局部最值问题,提出粒子群算法优化卷积核(particle swarm optimization-convolution kernel, PSO-ConvK)的图像识别方法。使用参数迁移法构造卷积神经网络,并提取卷积核,利用PSO不断更新粒子的速度和位置,寻找全局最优值以初始化卷积核,将其传递到卷积神经网络,用肺部肿瘤数据训练卷积神经网络,结合梯度下降法修正网络权重,使得PSO算法的全局优化能力与梯度下降法的局部搜索能力相结合。试验通过批次大小、迭代次数以及网络层数3个角度验证方法的有效性,并与高斯函数优化卷积核进行对比。结果显示, PSO优化卷积核的识别率始终高于随机化卷积核和高斯卷积核,识别率最终达到98.3%,具有一定的可行性和优越性。  相似文献   

13.
With the rapid development and popularization of artificial intelligence technology, convolutional neural network(CNN) is applied in many fields, and begins to replace most traditional algorithms and gradually deploys to terminal devices. However, the huge data movement and computational complexity of CNN bring huge power consumption and performance challenges to the hardware, which hinders the application of CNN in embedded devices such as smartphones and smart cars. This paper implements a convolutional neural network accelerator based on Winograd convolution algorithm on field-programmable gate array (FPGA). Firstly, a convolution kernel decomposition method for Winograd convolution is proposed. The convolution kernel larger than 3×3 is divided into multiple 3×3 convolution kernels for convolution operation, and the unsynchronized long convolution operation is processed. Then, we design Winograd convolution array and use configurable multiplier to flexibly realize multiplication for data with different accuracy. Experimental results on VGG16 and AlexNet network show that our accelerator has the most energy efficient and 101 times that of the CPU, 5.8 times that of the GPU. At the same time, it has higher energy efficiency than other convolutional neural network accelerators.  相似文献   

14.
In order to accomplish the task of object recognition in natural scenes, a new object recognition algorithm based on an improved convolutional neural network (CNN) is proposed. First, candidate object windows are extracted from the original image. Then, candidate object windows are input into the improved CNN model to obtain deep features. Finally, the deep features are input into the Softmax and the confidence scores of classes are obtained. The candidate object window with the highest confidence score is selected as the object recognition result. Based on AlexNet, Inception V1 is introduced into the improved CNN and the fully connected layer is replaced by the average pooling layer, which widens the network and deepens the network at the same time. Experimental results show that the improved object recognition algorithm can obtain better recognition results in multiple natural scene images, and has a higher degree of accuracy than the classical algorithms in the field of object recognition.  相似文献   

15.
为了提升交通标志自动识别的精度,提出一种基于多尺度CNN的交通标志识别方法(TSR -MSCNN算法).该方法采用三阶段卷积神经网络,融合了低阶、中阶和高阶3种不同尺度的特征,并串联了多个小卷积层用以代替单个较大卷积层.通过对全连接层的神经元个数、Dropout参数、卷积核尺寸等网络超参数进行选比实验,获得了最佳的网络超参数.利用德国交通标志基准数据库(GTSRB)对不同算法进行测试表明,本文提出的算法在较小的网络参数量下能够有效提取交通标志特征,获取的识别准确率达到99.76%,且显著优于传统卷积神经网络方法和多尺度特征方法的识别准确率,因此本文算法在图像识别领域有良好的应用价值.  相似文献   

16.
针对变压器型号多、图像复杂,以及传统基于机器学习的人工设计特征的方法不能对大规模变压器图像准确分类等问题提出了基于深度学习的变压器图像识别系统直接对原始图像进行"端对端"的学习。为实现变压器图像的准确分类,提出了改进VGG-16卷积神经网络的变压器图像识别模型。在VGG-16模型的基础上,重新构建了全连接层,针对原有的SoftMax分类器,采用3标签的SoftMax分类器进行替换,以实现网络结构优化,并通过迁移学习共享V GG-16模型卷积层和降采样层的权值参数。通过构建变压器图像的训练集和测试集对改进模型进行了训练,并进行性能测试。结果表明,与深度神经网络、卷积神经网络模型相比,改进VGG-16模型具有更好的效果,识别误差达到了9.17%,并实现了对3种变压器的准确区分。  相似文献   

17.
针对传统卷积神经网络(CNN)模型构建过度依赖经验知识、参数多、训练难度大等缺点,同时鉴于复杂多类问题的CNN模型构建策略的重要价值,提出一种自适应深度CNN模型构建方法.首先,将初始网络模型的卷积层和池化层设置为仅含一幅特征图;然后,以网络收敛速度为评价指标,对网络进行全局扩展,全局扩展后,根据交叉验证样本识别率控制网络展开局部扩展,直到识别率达到预设期望值后停止局部网络学习;最后,针对新增训练样本,通过拓展新支路实现网络结构的自适应增量学习.通过图像识别实验验证了所提算法在网络训练时间和识别效果上的优越性.  相似文献   

18.
基于支持向量机(SVM)的卷积神经网络(CNN)模型结合了大间隔原理,在图像识别中表现出了优异的泛化性能。然而,该方法忽视了一个关键:SVM的泛化性能不仅取决于不同类之间的间隔,还与所有样本的最小包含球(MEB)的半径有关。针对这一事实,文章提出一种基于半径间隔界(RMB)驱动的CNN模型的图像特征提取和识别的方法。与传统CNN模型相比,该模型采用基于SVM泛化误差界的策略来指导CNN深度模型学习和相应分类器构建,不仅考虑了不同类别之间的间隔,还考虑了MEB的半径。该模型能提高深度卷积模型的泛化能力而不会额外增加网络的复杂度,还能够应用于不同的深度模型中而不受限于某一特定的网络结构。在多个数据集上的实验结果表明,相比于基于Sofmax损失的CNN模型、基于中心损失的CNN模型以及基于 SVM 的 CNN 模型,该模型能够提取到鉴别性更强的图像特征,取得更高的识别率。  相似文献   

19.
为了提高卷积神经网络中卷积核对管道漏磁图像的特征学习能力,提出一种基于信息熵相似度约束的卷积核优化方法.建立一种信息熵相似度约束规则,通过判定条件对权值相近或相似度过高的卷积核进行优化.搭建实验平台并建立样本数据库进行实验,该方法可优化其特征提取能力,得到具有区分目标和背景语义信息能力的优化卷积核.结果表明,优化卷积核对目标具有较强的特征提取能力,能提高网络分类准确率和工作效率,实验结果与理论分析具有很好的一致性.  相似文献   

20.
In order to improve the accuracy of facial expression recognition and face classification in a local linear embedding network, an improved face image classification method based on the local linear embedding network is proposed. Based on the local linear embedding algorithm, the intra-class to inter-class discrimination matrix is used as the input of the network. At the same time, the reconstruction of the face image set is used to improve the local linear embedding algorithm, and the improvement of the local linear embedding algorithm based on clustering is embedded into the construction process of the convolution kernel, thus increasing the discrimination degree of different types of faces. By the Extended Yale B data set and Olivetti Research Laboratory data set on the contrast experiment, the experiment is analyzed in the treatment of facial expressions and the effects of various methods in the face recognition task, the results show that, compared with the other methods, the recognition rate of the proposed improved locally linear embedding network face image classification method is raised by 11%~26%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号