首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
顾恭 《计算机应用与软件》2021,38(8):206-213,279
车牌定位是车辆信息识别中的关键和基础.为解决在复杂无约束场景下存在的车牌定位精度不高,噪点和干扰因素较强等问题,提出一种基于最大稳定极值区域和卷积神经网络的车牌精准定位新方法.利用最大稳定极值区域找出车辆图像中二值化参数较为稳定的子图像区域;根据车牌的先验知识,滤掉明显不符合车牌字符特征的子图像区域;对保留下的子图像进行相应的启发式搜索和卷积神经网络识别,找出确切的多个车牌字符位置;通过滑动窗口和卷积神经网络搜索到车牌的始末位置,从而在复杂自然环境下完整获得车辆的牌照区域.实验结果表明,该算法在各类复杂场景下受到的环境影响小,鲁棒性强,定位准确率高.  相似文献   

2.
胡成伟  袁明辉 《软件》2020,(2):179-182
针对实际车牌识别系统中车牌位置定位难、字符识别率低等问题,提出了一种基于MSER与SVM算法的车牌定位识别。该方法分为定位和识别两步,输入图像经过预处理,通过MSER与SVM算法直接提取出车牌的字符区域,然后将车牌字符图像裁剪送入识别阶段,识别阶段同样利用SVM算法对车牌字符进行识别。经验证,该车牌定位识别方法识别速度快、准确率高,能够适用于实际生活中较为复杂的交通环境。  相似文献   

3.
为了克服目前公开的人脸表情数据集的数据量较少,并且有一些类别的表情表达存在一定的相似这两个因素对人脸表情识别率的影响,提出一种基于关键区域特征融合的人脸表情分类算法。算法首先提取人脸图像中表情表达的关键区域,然后分别提取关键区域的特征信息并融合,最终使用融合的特征进行分类。通过实验验证:算法在JAFFE和CK+公开数据集上均取得了较好的识别准确率。  相似文献   

4.
为解决传统链式特征融合只针对单一方向缺失的语义信息进行弥补,忽略语义信息来源多方向性的问题,提出一种对图像特征空间进行全局建模的方法。根据各个层级特征图对原始信息的多维度描述,设计特征增强模块(feature enhancement module,FEM),从多个方向弥补级联特征缺失的语义,达到增强CNN级联特征表达力的目的。经实验验证,FEM的使用在PASCALVOC2007测试数据集上达到了85.0%的平均精度均值(mean average precision,m AP),与依赖传统融合方式的检测算法相比最高提高了2.3%。  相似文献   

5.
唐乐  路林吉 《微型电脑应用》2012,28(3):61-64,69
针对传统图形匹配算法对稳定特征提取不充分的缺点,提出了一种基于MSER与SURF的图形匹配新方法。MSER与SURF是两种特征提取算法,各有优缺点,且具有互补的特性。提出的算法分别用MSER与SURF检测图像的特征点,用SURF描述子表征检测到的所有特征点,从而实现了两者的互补,并获取了更为丰富的特征描述。基于更丰富的特征,描述信息,进行特征匹配,最后得到的图像匹配效果,相比传统方法更加稳定。  相似文献   

6.
卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净语音信号的分布存在差异,特别是在复杂噪声环境下,使得传统卷积方式难以实现高质量的语音信号特征提取和过滤.为了解决上述问题,提出了多尺度区域自适应卷积模块,利用多尺度信息提升模型的特征感知能力;根据对应采样点的特征值自适应地分配区域卷积权重,实现区域自适应卷积,提升模型过滤噪声的能力.在TIMIT公开数据集上的实验表明,提出的算法在语音质量和可懂度的评价指标上取得了更优的实验结果.  相似文献   

7.
本文对RFID区域定位算法进行系统化的研究,通过对比测距技术和非测距技术,分析两种技术的优势与劣势,对RFID区域定位算法及技术实现进行描述。选取监狱这个特定实验场景后,对定位算法实验的结果进行了分析。  相似文献   

8.
相比传统特征,卷积神经网络提取的特征对图像具有更强的描述能力,其卷积层比全连接层更适合用来检索图像。然而卷积特征是高维特征,若直接用来匹配图像会消耗大量的时间和内存。提出了一种新的改善和整合卷积特征,形成单维特征向量,再将其用于图像匹配的方法。首先,提取最后一个卷积层的三维特征,再对该卷积特征重新加权,突显图像的边缘信息和位置信息;其次,用滑动窗口进行处理,形成多个区域特征向量,再相加整合成全局特征向量;最后,用余弦距离衡量查询图和测试图的相似性得出检索的初始排名,并且用拓展查询方法进行重排得出最终的平均精度均值mAP。分别在Paris6k和Oxford5k数据库以及用100k张图扩展的Paris106k和Oxford105k数据库上进行测试。相对于CroW方法在Paris数据库上获得的mAP性能指标,本文方法提升了约3个百分点;在Oxford数据库上提升了约1个百分点。实验结果表明,新方法提取的全局特征能够更好地描述图像。  相似文献   

9.
殷航  张智  王耀林 《计算机应用与软件》2021,38(10):168-172,195
针对在复杂的自然场景中中文本倾斜、模糊、光照等检测难题,提出一种基于卷积神经网络YOLOv3与最大极值稳定区域MSER的检测方法YOLOv3-M,并针对中文场景分别改善YOLOv3与MSER.通过YOLOv3算法对图像文本区域的矩形坐标进行回归预测,设计一个基于MSER的角度检测方法与之关联,实现倾斜文本行的检测.YOLOv3-M弥补了YOLOv3不能检测倾斜目标的缺点以及MSER检测容易被复杂场景干扰的缺点,并且YOLOv3与MSER都在检测速度上有着优秀的表现.实验结果表明,YOLOv3-M算法准确率达到81.2%,召回率达到69.7%,其检测速度达到45帧/s.  相似文献   

10.
针对红外与低照度可见光图像融合时,细微的纹理信息不能有效地保留的问题,提出了基于CNN与直方图规定化的红外与低照度可见光图像融合算法。首先,通过基于卷积神经网络的融合方法得到融合后的图像;其次,计算融合后图像的灰度直方图,通过直方图规定化将可见光图像的直方图映射到融合图像的直方图的区间上,以增强图像的纹理信息;最后,将直方图规定化的图像与红外图像通过卷积神经网络的方法进行融合,得到融合图像。实验结果表明,本文提出的算法在视觉效果和客观评价上均优于基于卷积神经网络的融合方法。  相似文献   

11.
基于CNN和LSTM的多通道注意力机制文本分类模型   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型。使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更好,可以有效提高文本分类的效果。  相似文献   

12.
医学图像融合技术因其包含多模态的图像信息,在临床应用中起着越来越重要的作用。医学图像融合效果符合人类视觉感知,减少先验知识对融合效果的影响和增强细节表现力一直是努力的方向。提出基于拉普拉斯金字塔和卷积神经网络的医学图像融合方法,针对图像伪影的问题采用区域拉普拉斯金字塔,为保存更多的细节信息并使参数自适应,对卷积神经网络进行改进。将源图像分别输入区域拉普拉斯金字塔进行分解,采用改进的卷积神经网络生成最优权重图指导融合过程,通过逆过程生成融合图像。实验结果表明,提出的方法在主观视觉和客观评价指标上都取得了良好的融合效果。  相似文献   

13.
心脏疾病严重威胁人类身体健康,心电图(Electrocardiogram,ECG)心拍分类对心脏疾病的临床诊断和自动诊断具有重要意义。现有基于深度学习生成的ECG心拍特征虽然优于基于传统方法生成的心拍特征,但是因ECG中各类间存在着严重的数据不平衡问题,致使现有基于深度学习方法生成的心拍特征的性能仍不甚理想。针对这一问题,以卷积神经网络(Convolutional Neural Network,CNN)为基础,在各类心拍等量数据基础上构建能有效表达各类心拍共性信息的共性CNN模型,以共性CNN模型和最小化类内距离最大化类间距离模型为基础,分别在各类心拍数据上构建能有效反映相应心拍类别倾向性信息的类别CNN模型,综合各心拍类别CNN模型的输出进行识别与分类。在MIT-BIH数据库上的实验结果显示,该方法识别分类心拍的各项指标均达到100%,解决了MIT-BIH数据库中ECG四类心拍自动识别分类的问题。  相似文献   

14.
针对传统长短时记忆网络(Long Short-Term Memory,LSTM)和卷积神经网络(Convolution Neural Network,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法。使用CNN提取文本局部信息,进而整合出全文语义;用LSTM提取文本上下文特征,在LSTM之后加入注意力机制(Attention)提取输出信息的注意力分值;将LSTM-Attention的输出与CNN的输出进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于LSTM、CNN及其改进模型效果更好,可以有效提高文本分类的效果。  相似文献   

15.
为有效提取与人类视觉感知高度相关的图像质量特征,提出了一个估计图像退化类型和质量评分的双目标卷积神经网络(CNN)结构。该网络结构有次序地分步提取用作退化类型分类和用作估计质量评分的特征,使网络更充分地挖掘图像退化类型信息并强化其对质量评分估计任务的辅助作用,进而提升了网络对图像质量特征的学习能力,同时实验表明两步特征提取的方式能加速网络的收敛。通过在标准图像质量评价数据库LIVE和TID2008上的对比实验,结果表明该算法在图像退化类型和质量评分两个任务中,整体性能均明显优于其他经典评价方法。  相似文献   

16.
针对现有基于内容的图像检索(Content-Based Image Retrieval,CBIR)方法中图像特征维度较大等问题,提出一种结合改进卷积神经网络(Convolutional Neural Network,CNN)和双线性模型的CBIR方法。采用一种低维度池化方法代替传统CNN中的池化过程,以此降低图像特征映射的维度。基于双线性模型的思想,使用两个特征提取器进行特征提取,并在每个图像位置上对两个特征进行内积,以形成最终的图像描述符。通过计算图像间的曼哈顿距离度量来评估相似性,获得相关图像及其排序。实验结果表明,该方法能够准确检索出相关图像,并具有较低的检索时间和内存消耗。  相似文献   

17.
将人工智能应用到医学图像中可减少医生工作量和患者的重复检查。针对现有甲状腺结节检测方法处理过程繁琐、特征提取困难等问题,提出一种基于卷积神经网络(CNN)的甲状腺结节检测方法。针对数据样本量小的限制,提出利用预训练与迁移学习改善网络性能的策略。根据不同结构CNN能够提取不同层次特征的特点,提出融合浅层与深层网络的方法。通过医院收集的3 414张图片对提出的方法进行验证,最终准确率为91.60%,灵敏度为90.08%,特异性为93.24%,接收者操作特征曲线下面积为96.55%。  相似文献   

18.
车辆精细型号是车辆识别的主要线索之一,也是智能交通系统的重要组成部分。针对车辆精细型号种类繁多、车辆所处环境复杂多变等因素,提出一种基于多尺度特征融合的车辆精细型号识别方法。该方法基于传统的卷积神经网络,通过提取并融合来自网络底层和高层的车辆特征,完成对车辆精细型号的识别。与其他基于卷积神经网络的车辆精细型号识别方法相比,该方法在提高分类准确率的同时还大幅度降低了整体网络的参数规模。实验结果表明,在公开数据集CompCars的监控场景下其识别精度达到了98.43%,且模型参数大小仅为3.93 MB,平均每张图片只需0.83 ms的分类时间。  相似文献   

19.
针对股票数据共线性和非线性的特点,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)和门控循环单元(Gated Recurrent Unit,GRU)神经网络的混合预测模型,并对沪深300指数、上证综指和深证成指进行了预测。该模型首先采用CNN提取特征向量,对原始数据进行降维,然后利用GRU神经网络学习特征动态变化规律进行股指预测。仿真结果表明,与GRU神经网络、长短时记忆(Long-Short-Term Memory,LSTM)神经网络和CNN相比,该模型能够挖掘历史数据中蕴含的信息,有效提高股指预测的准确率,并可为股指交易提供一些参考。  相似文献   

20.
卷积神经网络在图像分类和目标检测应用综述   总被引:3,自引:0,他引:3  
卷积神经网络具有强大的特征学习能力,随着大数据时代的到来和计算机能力的提升,近年来卷积神经网络在图像识别、目标检测等领域取得了突破性进展,掀起了新的研究热潮。综述卷积神经网络的基本原理,以及其在图像分类、目标检测上的研究进展和典型模型,最后分析了卷积神经网络目前的问题,并展望了未来的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号