首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
针对现有的基于车牌字符分割的车牌识别方法,在光照,阴暗等特定自然场景下存在无法定位且车牌字符无法正确分割,直接影响车牌字符识别效果的问题,提出一种基于深度学习的车牌定位和识别方法.首先采用深度学习FasterR-CNN算法进行车牌定位,利用k-means++算法来选择最佳车牌区域尺寸,解决现有车牌定位方法在某些自然场景下无法正确定位车牌的问题;然后在AlexNet网络模型的基础上进行改进和重新构建,提出一种增强的卷积神经网络模型AlexNet-L,该模型是一种针对车牌字符识别的端对端网络模型,可提高车牌识别准确率,避免现有的基于车牌字符分割的车牌识别方法中因无法正确分割车牌字符对车牌字符识别的影响.实验结果表明,该方法可以更有效地提高车牌定位和车牌字符识别的准确度和效率.  相似文献   

3.
商品图像检索的目标是检索与图像内容相符的商品,它是移动视觉搜索在电子商务中的重要应用.商品图像检索的发展,既为用户购物提供便利,又促进了电子商务向移动端发展.图像特征是影响商品图片检索性能的重要因素.复杂的图片背景、同类商品之间的相似性和被拍摄商品尺度的变化,都使得商品图像检索对图像特征提出了更高的要求.提出了一种多尺度深度神经网络,以便于抽取对复杂图片背景和目标物体尺度变化更加鲁棒的图像特征.同时根据商品类别标注信息学习图片之间的相似度.针对在线服务对响应速度的要求,通过压缩模型的深度和宽度控制了计算开销.在一个百万级的商品图片数据集上的对比实验证明:该方法在保持速度的同时提升了查询的准确率.  相似文献   

4.
信息时代的高速发展导致数据的大量产生与频繁传输,单单依靠人力很难处理这些数据.依托于人工智能的兴起与发展,数据的利用变得更加高效.表格作为一种特殊的数据形式,逐渐引起了广泛关注.概述了表格识别技术的发展,介绍了传统的表格识别技术及其缺点;介绍了基于深度学习技术的表格检测、表格结构识别、端对端检测与识别以及字符识别,重点...  相似文献   

5.
显著性目标检测通过模仿人的视觉感知系统,寻找最吸引视觉注意的目标,已被广泛应用于图像理解、语义分割、目标跟踪等计算机视觉任务中。随着深度学习技术的快速发展,显著性目标检测研究取得了巨大突破。本文总结了近5年相关工作,全面回顾了3类不同模态的显著性目标检测任务,包括基于RGB图像、基于RGB-D/T(Depth/Thermal)图像以及基于光场图像的显著性目标检测。首先分析了3类研究分支的任务特点,并概述了研究难点;然后就各分支的研究技术路线和优缺点进行阐述和分析,并简单介绍了3类研究分支常用的数据集和主流的评价指标。最后,对基于深度学习的显著性目标检测领域未来研究方向进行了探讨。  相似文献   

6.
遥感图像分析在国土资源管理、海洋监测等领域有着极为广阔的应用前景。深度学习技术已在图像处理领域取得突破性进展,然而,遥感图像固有的尺寸大、目标小而密集等特点,使得将面向普通图像的深度学习方法用于遥感目标检测普遍存在定位不准确、小目标检测难、大图检测精度差等问题。针对上述难题, 提出了一种新型遥感图像目标检测算法DFS。与传统机器学习方法相比,DFS 设计了新的维度聚类模块、定制损失函数和滑动窗口分割检测机制。其中,维度聚类模块通过设计聚类机制优化定制先验框,提高定位精度;定制损失函数提高对船只等小目标的检测精度;滑动窗口分割检测解决大图检测精度低的问题。在经典遥感数据集上开展的实验对比表明,与YOLOv2相比,DFS算法的mAP提高了256%,小目标检测效率及大图检测效能大幅提高。  相似文献   

7.
随着近年来深度学习技术的发展,图像显著性目标检测的研究重点偏向于利用深度学习方法解决问题。为了全面且深入地探究图像显著性目标检测领域,基于深度学习框架,回顾近五年出现的20余种深度学习方法,归纳出四类深度学习策略,并且对比了它们在4个显著性数据集上的评价结果。结果显示,各类策略在不同数据集上的F度量值为0.800—0.950,综合利用多种策略的方法可以取得更优的预测指标,但仍然存在复杂场景干扰下检测有误的问题。针对现有问题,提出加强深度学习方法在复杂数据集上的训练,进而优化显著目标预测结果的定位准确性及边缘完整性。  相似文献   

8.
针对深度学习如何应用于数学书面作业批阅问题,通过对图像的预处理以及优化图片训练集和图像处理算法,实现文本字符切割,采用Tesseract-OCR光学字符识别方法,训练公式中存在的字符样本,通过与纸面上的公式匹配提高识别的准确性,最后采用java可视化界面实现算式识别的功能,对不同情况下拍摄的照片进行测试.测试结果表明该系统高效、精准、实用.  相似文献   

9.
针对图像目标检测的嵌入式实时应用需求,采用合并计算层的方法对基于MobileNet和单发多框检测器(SSD)的深度学习目标检测算法进行了优化,并采用软硬件结合的设计方法,基于ZYNQ可扩展处理平台设计了实时图像目标检测系统。在系统中,根据优化后的算法设计了一款多处理器核的深度学习算法加速器,并采用PYTHON语言设计了系统的软件。经过多个实验测试,深度学习目标检测系统处理速度可以达到45FPS,是深度学习软件框架在CPU上运行速度的4.9倍,在GPU上的1.7倍,完全满足实时图像目标检测的需求。  相似文献   

10.
光学遥感图像的目标检测 (Optical remote sensing images object detection, ORSIOD) 是航空和卫星图像分析领域的一个基本但具有挑战性的问题, 近年来受到广泛关注. 本文从如下几个方面介绍了基于深度学习的光学遥感图像目标检测的研究现状. 首先对光学遥感图像目标检测的主要难点进行了介绍, 接着对现有基于深度学习的目标检测算法进行概括, 并以光学遥感图像目标检测的难点为驱动分析对比了不同的基于深度学习的光学遥感图像目标检测方法的优缺点, 最后对未来的发展趋势进行了详细的分析.  相似文献   

11.
近年来,深度学习在计算机视觉各个领域中的应用成效显著,新的深度学习方法和深度神经网络模型不断涌现,算法性能被不断刷新.本文着眼于2016年以来的一些典型网络和模型,对基于深度学习的计算机视觉研究新进展进行综述.首先总结了针对图像分类的主流深度神经网络模型,包括标准模型及轻量化模型等;然后总结了针对不同计算机视觉领域的主...  相似文献   

12.
肝脏肿瘤的评估是结直肠癌肝转移临床诊疗的重要步骤。为了完成腹部CT影像中的肝脏肿瘤自动分割和检测任务,提出一种改进的级联深度学习网络。级联网络采用U-Net和Mask R-CNN模型分别完成分割和检测任务。训练U-Net模型作为级联网络的第一层来分割肝脏器官作为感兴趣区域(ROI);针对ROI区域进行形态学活动轮廓提取;使用U-Net模型和Mask R-CNN模型作为级联网络的第二层分别完成精准分割和检测ROI内肝脏肿瘤的任务。实验结果表明,对于级联U-Net模型的肝脏转移瘤分割平均Dice系数为74%;Mask R-CNN的肿瘤实例分割Dice系数为67%(置信度为95%),均值平均精度(mAP)为88%。  相似文献   

13.
李文英  曹斌  曹春水  黄永祯 《自动化学报》2018,44(11):2023-2030
考古出土的青铜器铭文是非常宝贵的文字材料,准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学研究均有重要意义.青铜器铭文的辨识需要综合文字的形、音、义进行研究,其中第一步也是最重要的一步就是分析文字的形体特征.本文提出一种基于两阶段特征映射的神经网络模型来提取每个文字的形体特征,最后对比目前已知的文字研究成果,如《古文字类编》、《说文解字》,得出识别的结果.通过定性和定量的实验分析,我们发现本文提出的方法可达到较高的识别精度.特别地,在前10个预测类别中(Top-10)准确率达到了94.2%,大幅缩小了考古研究者的搜索推测空间,提高了青铜铭文识别的效率和准确性.  相似文献   

14.
在各种灾害中,火灾是最经常、最普遍的威胁公众安全和社会发展的主要灾害之一。随着经济建设的迅猛发展,城市规模日趋扩大,重大火灾隐患急剧增加。然而,目前广泛使用的烟雾传感器探测火灾的方法,易受距离等因素影响,导致检测不及时。视频监控系统的引入为解决这一问题提供了新思路,基于视频的传统图像处理算法是较早提出的方法,最近机器视觉与图像处理技术快速发展,涌现出一系列使用深度学习技术来自动检测视频和图像中火灾的方法,在消防安全领域具有非常重要的实际应用价值。为了综合分析火灾检测的深度学习方法相关改进及应用,简要介绍了基于深度学习的火灾检测流程,重点从分类、检测、分割3个粒度对火灾检测的深度方法详细对比分析,阐述每类算法针对现有问题采取的相关改进。总结现阶段火灾检测存在的问题,并提出未来的研究方向。  相似文献   

15.
甲骨文字图像可以分为拓片甲骨文字与临摹甲骨文字两类. 拓片甲骨文字图像是从龟甲、兽骨等载体上获取的原始拓片图像, 临摹甲骨文字图像是经过专家手工书写得到的高清图像. 拓片甲骨文字样本难以获得, 而临摹文字样本相对容易获得. 为了提高拓片甲骨文字识别的性能, 本文提出一种基于跨模态深度度量学习的甲骨文字识别方法, 通过对临摹甲骨文字和拓片甲骨文字进行共享特征空间建模和最近邻分类, 实现了拓片甲骨文字的跨模态识别. 实验结果表明, 在拓片甲骨文字识别任务上, 本文提出的跨模态学习方法比单模态方法有明显的提升, 同时对新类别拓片甲骨文字也能增量识别.  相似文献   

16.
随着人工神经网络技术的发展,深度学习逐渐成为人工智能领域的研究重点.在情感识别领域,深度学习也有着极为强大的理论与技术优势,其能够显著提升情感识别的准确性.同时,深度学习下的情感识别对于智慧化学习环境的营造有着积极意义,所以将之应用到教育教学工作中是切实可行的.本文对深度学习进行了简单介绍,并分析了当前情感识别的研究进...  相似文献   

17.
针对智能治超场景下超载车辆自动化检测的需求,在YOLOv5s的基础上从数据、模型和算法三个方面提出了一种改进的货车车型识别算法。在数据层面,使用的数据增强模拟了现实中面对恶劣天气、图像噪声和数据损坏等复杂场景,丰富了训练数据的多样性,提高了模型在复杂场景下的鲁棒性。在模型方面,提出了一种新的注意力机制来综合考虑不同通道的重要性和编码特征的位置信息,提高了模型的识别准确性。在算法层面,针对现有算法的不足,提出了一种更通用的标准来判断货车与轮轴的隶属关系,以适用更复杂的场景。实验结果表明,提出的改进模型对货车和轮轴的识别精度分别达到99.34%和99.22%,对货车车型识别的准确率为98.71%。与经典的YOLOv5s网络相比,货车和轮轴的平均识别精度提高了2.39%,货车车型的识别准确率提高了2.22%。综上,所提出的方法实现了对货车车型自动和准确的识别,可以为智能治超场景下的货车车型识别提供理论支撑。  相似文献   

18.
为解决安防业务中对人脸识别技术的迫切需求,进行了基于深度学习的证件照人脸识别方法的研究与实现.对人脸识别各关键技术环节进行了实现并进行了算法对比,同时提出了使用Siamese网络进行特征重映射的方法进一步提升人脸识别精度.实验结果表明,使用证件照构建的人脸库,通过基于深度学习的算法实现了高效精确的人脸识别.  相似文献   

19.
图像处理软件的飞速发展,带动了移动应用领域一大批修图、美化应用的兴起。但是修图、美化软件的快速发展和普及也带来了一些社会问题和安全问题,如网恋对象严重失真,摄影作品造假等。针对手机中的修图处理APP软件,提出一种基于多数据集特征学习的神经网络模型,并给出其网络拓扑结构。区别于传统的多个神经网络并行操作,提出的网络模型具有共享模型参数的特征,能同时对多个特征数据集进行深度学习,使检测程序具备多特征识别能力。此外,还提出了一种针对多任务网络模型的损失函数,以增强深度特征学习的能力。实验结果表明,提出方法的准确率较传统方法有较大提升,同时泛化性能优越,能识别出经过多种美图、修图软件修复过的图像。  相似文献   

20.
眼底血管图像分割对青光眼、糖尿病视网膜病变等多种眼部疾病有较好的辅助诊断作用, 目前深度学习因其强大的抽象特征发现能力, 有望满足人们从眼底血管图像中提取特征信息进行图像自动分割的需求, 成为眼底血管图像分割领域的研究热点. 为更好把握该领域的研究进展, 本文对相关数据集和评价指标整理归纳, 对深度学习在眼底血管图像分割中的应用进行详细阐述, 重点梳理各类分割方法的基本思想、网络结构及改进之处, 分析现有眼底血管图像分割方法存在的局限性及面临的挑战, 并对该领域未来的研究方向做出展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号