首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
LeNet-5卷积神经网络(CNN)虽然在手写数字识别上取得很好的分类效果,但在具有复杂纹理特征的数据集上分类精度不高。为提高网络在复杂纹理特征图像上分类的正确率,提出一种改进的LeNet-5网络结构。引入跨连思想,充分利用网络提取的低层次特征;把Inception V1模块嵌入LeNet-5卷积神经网络,提取图像的多尺度特征;输出层使用softmax函数对图像进行分类。在Cifar-10和Fashion MNIST数据集上进行的实验结果表明,改进的卷积神经网络在复杂纹理特征数据集上具有很好的分类能力。  相似文献   

2.
为了解决传统验证码识别方法效率低,精度差的问题,设计了一种先分割后识别的验证码处理方案。该方案在预处理阶段用中值滤波去噪,再利用霍夫变换对图像字符进行矫正;在字符分割阶段,利用垂直投影算法确定验证码字符块个数,以及字符坐标点,再用颜色填充算法对验证码进行初步分割,根据分割后的字符块数量对粘连字符进行二次分割;在识别阶段,我们对LeNet-5网络进行了改进,修改了输入层,并用全连接层替换了LeNet-5网络中的C5层,以此来对验证码字符进行识别;实验表明,对于非粘连验证码和粘连验证码,单张图片分割时间为0.14和0.15ms,分割准确率为98.75%和97.25%,识别准确率为99.99%和97.7%;结果表明,该算法对验证码分割和识别都有着很好的效果。  相似文献   

3.
针对煤矿井下光照分布不均匀造成视频图像失真,火灾识别精度低等问题,提出了一种矿井火灾视频图像智能识别方法。该方法以YOLOv5为识别模型,采用K-means算法对传统的暗通道图像去雾算法进行改进,并用改进算法对采集的火焰图像进行去雾处理,提高矿井火灾视频图像识别精度;为减少静态背景对火灾识别的影响,采用帧差法与混合高斯模型融合算法,对动态演化的火焰图像进行特征提取,并采用形态学处理算法消除图像中存在的缺口,从而得到更加完整的火焰目标图像;对火灾视频图像数据集进行标注,并输入到YOLOv5算法模型进行训练及测试。结果表明:基于YOLOv5的矿井火灾视频图像智能识别方法平均精度为92%,损失函数为0.6,比传统算法Alexnet,VGG16,Inceptionv3的平均精度分别高9.6%,13.5%,4.9%,表明该方法检测速度快、精度高,可有效提高矿井火灾识别准确率。  相似文献   

4.
针对现有面部表情识别算法耗时长、收敛速度慢、分类精度低等问题,对LeNet-5网络的框架和内部结构进行双重优化和改进,并提出一种基于改进LeNet-5的面部表情识别方法。为了能够提取更加多样化的特征,同时提升特征表达能力,首先增加卷积层和池化层的个数,调整网络内部参数;其次,通过对卷积层、全连接层进行批规范化处理,提高网络模型的泛化能力;最后,3个池化层以maxpool_avgpool_avgpool的组合方式进行重叠池化。在FER2013人脸表情数据库进行实验,结果表明改进后的模型相较于目前的算法具有更高的识别精度。  相似文献   

5.
研究LeNet-5在扫描文档中手写体日期字符识别的应用,由于文档扫描的过程中会引入各种噪声,特别是光照和颜色干扰,直接使用LeNet-5算法不能取得较好效果。先在整份文档中对特定待识别字符的进行定位和划分,并对划分出的字符图像进行去噪、灰度化和二值化处理等预处理,接着将字符图像分割成一个个单个字符,然后在LeNet-5网络基础上结合模型匹配法实现对手写体日期字符的识别。分析在不同参数组合下的识别效果,调整算法模型参数有效地提升了模型对于实际对象的性能,实现出一种能够对手写体日期字符集实现较好识别效果的算法。实验结果表明了算法的有效性,并应用于具体工程实践。  相似文献   

6.
基于跨连接LeNet-5网络的面部表情识别   总被引:6,自引:0,他引:6  
为避免人为因素对表情特征提取产生的影响,本文选择卷积神经网络进行人脸表情识别的研究.相较于传统的表情识别方法需要进行复杂的人工特征提取,卷积神经网络可以省略人为提取特征的过程.经典的LeNet-5卷积神经网络在手写数字库上取得了很好的识别效果,但在表情识别中识别率不高.本文提出了一种改进的LeNet-5卷积神经网络来进行面部表情识别,将网络结构中提取的低层次特征与高层次特征相结合构造分类器,该方法在JAFFE表情公开库和CK+数据库上取得了较好的结果.  相似文献   

7.
为提高表情识别精度,结合传统的深度卷积神经网络,提出一种基于深度度量融合算法的表情识别模型。首先通过DCNN(Dynamic Convolution Neural Network,深度卷积神经网络)模块对人脸图像特征进行学习,然后同步优化Softmax分类损失函数和三元组损失函数。在三元组损失函数优化方面,提出一种对称三元组损失函数Lw,以避免不完整判断问题,最后以CK+等作为数据来源,通过上述模型对表情进行识别。结果表明,本改进的表情识别方法,可有效辨识高兴、厌恶和藐视等表情,但对恐惧、生气等表情识别精度不高;与其他表情识别算法相比,本识别算法识别精度最高,达到97.86%,具有很大识别优势。  相似文献   

8.
针对中华传统刺绣工艺传承保护问题中的分类任务,传统的刺绣分类方法存在耗时长、精度低以及需要大量掌握专业知识的人力资源等问题;设计了一种基于改进DenseNet的刺绣图像分类识别方法;构建刺绣图像分类识别数据集;采用局部二值模式LBP、Canny算子边缘提取以及Gabor滤波等方式提取纹理特征,将不同特征图与原图合并为四至六通道图像数据集送入网络进行消融试验,扩充了数据集宽度;为稳定训练过程,加速损失收敛速度,提出引入SPP (spatial pyramid pooling)结构优化模型;为提高分类识别精度使用Leaky ReLU激活函数优化ReLU函数;实验结果表明基于改进DenseNet的刺绣图像分类识别方法可解决传统刺绣图像分类方法中存在的问题,改进后的刺绣图像分类模型与基准模型相比准确率提高了8.1%,高达97.39%。  相似文献   

9.
基于人脸信息的身份认证对于个人安全和社会稳定都具有非常重要的意义。传统的人脸认证方法依赖人工构造视觉特征,易受外界条件影响,识别精度不高。深度学习模型以自主学习方式进行特征提取,能从复杂的数据中提取到人脸的隐性特征。然而大部分深度学习人脸认证方法需大量带有身份标记的训练样本,额外增加了标记数据的成本。针对以上问题,提出了融合LeNet-5和Siamese神经网络模型的人脸认证算法。该算法在Siamese神经网络框架基础上,引入LeNet-5卷积神经网络,将单分支LeNet-5卷积网络扩充为结构相同且参数共享的双分支LeNet-5卷积网络,通过缩小卷积核、增加卷积层来调整网络结构,使用Contrastive Loss函数对融合网络进行训练。实验结果表明,该算法在不同的人脸数据集上,均获取较高的识别精度。  相似文献   

10.
为解决电磁频谱中的未知信号分类和身份识别问题,提出一种基于改进卷积神经网络(CNN)LeNet-5模型的信号分类方法。该方法使用信号全双谱做为CNN的输入,然后通过改进的LeNet-5模型学习信号特征并完成信号分类和身份识别。实验结果表明,算法对未知信号调制类型识别率达97%以上,对信号身份属性识别率达96%以上。相比传统方法,该算法对信号身份属性识别率提高6.5%,具有更好的泛化性能,并有效解决了全双谱应用的二维模板匹配和Loss函数值下降缓慢问题。  相似文献   

11.
基于神经网络和证据理论的图像目标识别研究   总被引:10,自引:1,他引:9  
黄金  程咏梅  皮燕妮  潘泉 《计算机仿真》2005,22(11):184-187
提出了一种基于BP神经网络和D-S证据推理的多传感器数据融合图像目标识别算法,利用数据融合的思想对来自目标的多幅图像进行空间域融合处理.首先提取图像的Hu不变矩作为待识别目标图像的特征,尔后针对DS证据理论基本概率指派函数构造困难的问题,用BP神经网络对目标的初步识别结果构造基本概率指派函数,最后用Dempster组合规则对BP网络的初步识别结果进行决策级数据融合,完成了三维飞机图像目标的识别仿真.仿真结果表明了融合识别方法的有效性和鲁棒性,识别率达到100%.  相似文献   

12.
宫颈癌是一种严重威胁女性生命及身体健康的重大疾病。宫颈细胞涂片图像是进行癌变识别的重要诊断依据。为了提高癌变细胞的识别精度,本文在胶囊神经网络(CapsNet)的基础上,提出了一种改进的胶囊神经网络模型( improved-Caps-Net,i-CapsNet)。 首先,针对宫颈癌涂片图像具有三维通道数据特征,构建了多维度数据输入层,并增加三维数据深度卷积层, 增强图像深层特征提取能力。其次,改进了编码器中的动态路由方式,采用C-squashing非线性函数作为激活函数,更快速准确地实现胶囊模长的压缩,达到提高癌变细胞的识别精度。然后,针对 Herlev公共数据集中正负样本量不平衡现象,将阿里天池宫颈液基薄层电镜扫描图像进行癌细胞图像提取及图像预处理,构建负样本数据集,提高了数据集的多样性和均衡性。最后,采用十折交叉验证方法,进行训练、验证及测试,与SVM、LeNet-5、VGG16、CapsNet模型进行效果对比。本文提出的i-CapsNet模型训练的Loss值最小,收敛到0.0074,测试的识别精度最高,达到99.2%,效果良好,验证了所提出的i-CapsNet的有效性和可行性。  相似文献   

13.
刘伟  王亮 《计算机仿真》2023,(3):219-223
已有人脸表情智能识别方法存在图像遗漏、识别速度慢、以及表情易混淆的问题,导致识别正确率低,且不适用于多人脸识别。为解决上述问题,提出小规模数据多角度人脸表情人工智能识别方法。结合去噪自编码器、稀疏自编码器及普通自编码器组成具有5层网络结构的堆栈式混合自编码器。在网络结构中训练数据样本,并对样本完成微调、权重初始化和更新。再结合粒子群优化分类器识别表情,将粒子最优值带入人脸表情识别目标函数,获得判定表情的决策矩阵,完成人脸表情人工智能识别。仿真结果表明,所提方法识别多人表情识别时无遗漏,且识别速度快、精度高、人脸表情不易混淆。  相似文献   

14.
对于人脸表情识别,传统方法是先提取图像特征,再使用机器学习方法进行识别,这种方法不但特征提取过程复杂且泛化能力也差。为了达到更好的人脸表情识别效果,文中提出一种结合特征提取和卷积神经网络的人脸表情识别方法。首先使用基于Haar-like特征的AdaBoost算法对于数据库原始图片进行人脸区域检测,然后提取人脸区域局部二值模式(Local Binary Patterns,LBP)特征图,将其尺寸归一化后输入到改进的LeNet-5神经网络模型中进行识别。在CK+和JAFFE数据集上采用10折交叉验证方法进行实验,分别为98.19%和96.35%的准确率。实验结果表明该方法与其他主流方法相比在人脸表情识别上有一定的先进性和有效性。  相似文献   

15.
赤足足迹识别技术是图像识别技术的一个分支,在刑侦、医疗以及安全领域发挥着重要作用,有望成为一种新的进行人身识别的手段。但是该技术尚未形成较为统一的框架,也没有一个规范化的流程。为了给今后的研究人员提供指导,需要规范不同足迹图像的识别流程,并对赤足足迹识别技术相关研究进行归纳与总结。首先对赤足足迹识别研究的背景和意义进行阐述,然后回顾该技术的发展脉络,并根据采集方式的不同将赤足足迹图像分为油墨捺印足迹图像、足底扫描图像、光学足迹采集设备采集的足迹图像以及足迹压力采集系统采集的足压图像四类,并指出后两种图像是目前赤足足迹识别研究的热点。之后分别从赤足足迹数据集、图像预处理、识别方法三个方面分析赤足足迹识别技术的研究现状。其中,识别方法分为传统方法和基于深度学习的方法,后者又进一步划分为网络结构创新方法和损失函数优化方法。在给出识别方法的评价指标后,从多个方面对各种方法进行对比。最后指出该技术目前面临的问题,并对其今后的发展方向进行展望。  相似文献   

16.
目的 动物个体身份识别一直是智慧畜牧业的主要难题之一,由于动物个体本身与人类在图像识别上需要的数据特征不同以及各个特征作为个体属性之间的关系不明确,对动物个体识别领域的研究较少,针对具有高相似度的奶山羊个体身份识别问题,提出了基于深度学习的高相似度的奶山羊识别方法。方法 采集了26只萨能奶山羊的全身图像,利用SSD(single shot MultiBox detection)网络进行数据集预处理,并随机选取1 040幅图像作为训练集,260幅图像作为测试集。其次采用ResNet18(residual neural network)预训练模型并进行迁移学习,最后联合三元组损失函数与交叉熵损失函数进行参数调整。研究表明,采用联合损失函数并结合Adam优化器算法时,可获得较好的识别效果。此外,在实验部分针对奶山羊的特征选取问题上,对奶山羊的羊脸区域与奶山羊的全身区域分别采用了三元组损失函数与孪生网络,验证了对奶山羊的识别仅靠羊脸区域的特征时准确率较低;此外,针对网络的训练,本文不仅通过YOLOv3(you only look once)以及孪生网络(siamese network)验证了奶山羊本身属于高相似度的数据集,而且针对奶山羊数据集分别采用三元组损失函数与交叉熵损失函数作为唯一的损失函数,并验证了该方法的有效性。结果 奶山羊识别的最高精准度为93.077%,相较于Triplet-Loss损失函数74.615%的准确率以及CrossEntropy-Loss 89.615%准确率有了较大提升。结论 本文提出的基于深度学习的高相似度的奶山羊识别方法不仅具有较高的准确率,而且在奶山羊个体身份识别方面具有极大的应用价值,有助于准确识别羊的身份,为相似度高的动物个体身份识别提供了思路。  相似文献   

17.
周晨  刘磊 《计算机仿真》2022,39(2):212-216
传统的树种分类识别方法未进行最大池化操作,导致树种分类识别精度差。现引入分形维度进行林业遥感图像树种分类识别。通过ROI区域截取获取遥感树种图像,利用直方图均衡化方法进行原始图像预处理,以便获得高质量与清晰度的林业遥感图像;通过分形维度理论分析提取的林业遥感图像纹理特征,完成卷积神经网络模型的优化构建;将林业遥感图像纹理特征输入卷积层,经卷积层的卷积操作并计算特征数据,池化池通过最大池化操作卷积层输出的数据;通过Relu激活函数对林业遥感图像树种纹理特征进行深度分析,利用Softmax分类器实现树种分类识别。实验结果表明,上述方法预处理后的遥感图像质量高,且林业遥感图像树种分类识别的效率高,分类识别的时间低至35.7ms,分类识别的准确率高达95.62%。  相似文献   

18.
为有效识别人脸区域,提升其在多种领域应用效果,设计基于人工智能技术的高光谱人脸自动化识别系统。以模块化思想设计嵌入式系统架构,采集与预处理高光谱人脸图像,并将预处理后的图像数据放入RAM存储器;人脸检测模块调用RAM存储器存储数据,并加载Haar人脸分类器,完成人脸区域检测提取工作;之后由人脸特征提取与识别模块经人脸区域LBP特征提取、LeNet-5卷积神经网络人脸识别模型构建与训练等操作,输出人脸识别结果。实验结果表明,该系统能够在较短时间内完成LeNet-5卷积神经网络人脸识别模型训练。  相似文献   

19.
为了快速准确的获取银行卡号信息,文章介绍了一种改进的LeNet-5神经网络结构.首先需要对原始数据预处理,通过数学形态学进行粗定位,最后通过卡行号的位置和特征进行精确定位.在卡号分割阶段,通过转换颜色空间对背景信息进行了去除,再使用了投影分析法对银行卡号分布形态做出了判断,最后使用K均值聚类算法对卡号行图像进行分割.在卡号识别阶段,先对数据进行数据增强,再用其对模型进行训练,将分割后的单独字符图像输入改进后的卷积神经网络LeNet-5对卡号进行识别,识别率达到了99.6%.  相似文献   

20.
韩殿元 《计算机科学》2010,37(8):287-289
传统火灾探测技术存在许多缺陷.提出了一种基于图像的火焰识别方法.首先将图像由RGB模式转换为YCbCr模式,以Cb,Cr为轴建立坐标系并绘出火焰样本的Cb,Cr值.用一个椭圆将绘出的坐标点包括起来,并创建椭圆方程和二维正态分布函数,使正态分布函数在椭圆外部的值为零,并用L-M算法对正态分布函数中的参数进行优化.对火焰的识别转换为判断正态分布函数在像素对应的Cb,Cr处的值是否大于零.该方法具有很好的实时性和识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号