首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
许肖  顾磊 《计算机科学》2015,42(6):288-292
针对复杂背景下的文本检测问题,提出了一种基于主动轮廓模型的文本检测方法.输入的图像首先经过so-bel-laplacian锐化后再由gaussian-laplacian进行过滤.预处理完成后的图片首先通过改进的主动轮廓模型得到初始轮廓,再通过算法的反复迭代扩大或缩小轮廓线得到最终轮廓,最后通过后处理尽量排除非文本块,从而得到最终文本区.区别于以往检测方法,所提方法最终不但可以框出文本行,还可以框出单个文本,有利于后续分割识别的进行.实验表明所提方法可有效检测出图像中的文本.  相似文献   

2.
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。  相似文献   

3.
4.
肖斌  汪敏 《计算机系统应用》2012,21(1):168-171,89
在交通监控中,从复杂的交通场景中精确地分割出运动目标是至关重要的。目前,经典的运动目标检测算法有背景差法和帧差法。当场景中存在阴影时,这两种方法都不能够精确地提取运动目标。提出了一种基于主动轮廓模型的运动目标提取算法。通过阴影检测,从运动目标中获得消除阴影的初始轮廓,然后通过主动轮廓模型逼近运动目标真实轮廓。实验表明,该算法既可以消除阴影和噪声的影响,又可以保持运动目标完整。  相似文献   

5.
目前,基于深度学习的自然场景文本检测在复杂的背景下取得很好的效果,但难以准确检测到小尺度文本.本文针对此问题提出了一种基于特征融合的深度神经网络,该网络将传统深度神经网络中的高层特征与低层特征相融合,构建一种高级语义的神经网络.特征融合网络利用网络高层的强语义信息来提高网络的整体性能,并通过多个输出层直接预测不同尺度的文本.在ICDAR2011和ICDAR2013数据集上的实验表明,本文的方法对于小尺度的文本,定位效果显著.同时,本文所提的方法在自然场景文本检测中具有较高的定位准确性和鲁棒性,F值在两个数据集上均达到0.83.  相似文献   

6.
应用主动轮廓模型对道路现场的行人轮廓和障碍物进行精确轮廓的提取,为基于视觉的辅助驾驶系统中的潜在障碍物分类提供一个有效的手段。首先讨论主动轮廓模型,然后分别应用GVF-Snake模型和level set模型对行人轮廓边缘进行提取实验,并对实验结果进行分析。  相似文献   

7.
8.
基于遗传算法的主动轮廓模型   总被引:2,自引:0,他引:2       下载免费PDF全文
由 Kass等人提出的主动轮廓模型 ,本质上是一条能量最小化的轮廓曲线 .它作为一种全新的采用自上而下机制的图象目标提取方法 ,由于它有效地利用了高级信息 ,从而提高了目标提取的速度和准确性 ,已经在数字图象处理和计算机视觉领域得到了广泛的应用 .原始的主动轮廓模型算法可以分为构造能量函数、推导欧拉方程、离散化和迭代求解 4步 .但该算法存在许多问题 ,为此在分析原始主动轮廓模型算法和一些改进算法的基础上 ,提出了一种基于遗传算法的主动轮廓模型算法 ,并给出实验结果 .实验结果证明 ,基于遗传算法的主动轮廓模型不仅成功地解决了原方法收敛易陷入局部最小值的问题 ,也提高了目标提取的成功率 .  相似文献   

9.
牛钦 《计算机时代》2021,(6):19-21,25
场景文本检测是计算机视觉领域研究的主要方向.文章介绍了近几年深度学习技术在场景文本检测上的应用,包括对场景文本图像检测中存在问题的描述,对近些年场景文本检测算法的分类和分析,以及场景文本检测数据集的介绍.最后总结并展望了未来场景文本检测的发展趋势.  相似文献   

10.
邓梁  刘曼玲  范洁 《计算机工程》2009,35(15):215-216,219
针对传统主动轮廓模型不能有效拟合凹陷轮廓的问题进行研究,从内部、外部能量两方面进行分析。通过模拟流体压力的思路对内部能量项中的弹性能量进行改进,提出一种针对凹陷轮廓改进的主动轮廓模型——Area Snake,并对其理论模型、实现细节和不足进行讨论。实验表明,Area Snake对凹陷轮廓有着较好的拟合性能。  相似文献   

11.
张国锋  周明全 《计算机工程》2004,30(18):59-60,115
在传统的snake算法基础上,针对人脸轮廓提取这一课题,提出了一种初始化snake的方法,并对传统的snake算法进行了改进。实验结果表明,该方法能够较好地提取人脸轮廓,并在精确度和计算量方面大大优于边缘检测算子方法。  相似文献   

12.
自然场景文本检测对于机器理解场景等有着重要作用。近年来,随着深度学习的发展,自然场景文字检测方法也日新月异,取得了很好的检测效果。分析、总结了近年来基于深度学习的场景文字检测方法,将其归纳分类为基于回归、基于分割,以及两者混合三种类型,并对各类检测方法的优缺点进行了对比分析。介绍了场景文本检测性能指标及常用的公开数据集以及下载方式。对场景文字检测领域研究进行总结和展望,有望为深度学习场景文本检测方法提供新的研究方向。  相似文献   

13.
随着深度学习技术的发展,自然场景文本检测的性能获得了显著的提升.但目前仍然存在两个主要的挑战:一是速度和准确度之间的权衡,二是对任意形状的文本实例的检测.本文采用基于分割的方法高效准确的检测任意形状场景文本.具体来说,使用具有低计算成本的分割头和简洁高效的后处理,分割头由特征金字塔增强模块和特征融合模块组成,前者可以引入多层次的信息来指导更好的分割,后者可以将前者给出的不同深度的特征集合成最终的特征进行分割.本文采用可微二值化模块,自适应地设置二值化阈值,将分割方法产生的概率图转换为文本区域,从而提高文本检测的性能.在标准数据集ICDAR2015和Total-Text上,本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.  相似文献   

14.
当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法.在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;在损失函数的设计中引入...  相似文献   

15.
由于受到面部五官、饰物等因素的影响,传统几何活动轮廓模型获取人脸外轮廓会产生凹陷、分片等现象.针对人脸图像的特点,将边缘外张力能量及肤色能量与全局能量结合,提出一种基于混合能量泛函的几何活动轮廓模型,有效地避免了这些问题.首先,根据演化曲线的邻域信息赋予边缘点向外的张力,使曲线能够克服面部特征及面部饰物的干扰,引导其向外轮廓方向演化.鉴于肤色是面部最重要的特征,提出肤色能量,进一步提高了模型的鲁棒性.此外,提出一种基于单高斯模型的改进算法,能够估计出接近实际人脸外轮廓的初始位置,为轮廓演化奠定了基础.在两个公共人脸库上进行测试,该方法能够得到准确的人脸分割效果;以手工分割的结果为基准,该算法定位精度明显优于传统的全局能量模型和局部能量模型.还用日常照片创建一个包含不同姿态、光照、复杂背景等因素、复杂的人脸库,分割结果表明,该方法能够克服这些因素的影响,取得了准确而稳定的人脸分割结果.  相似文献   

16.
王建新  王子亚  田萱 《软件学报》2020,31(5):1465-1496
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势.  相似文献   

17.
自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战.为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全局特征融合,对恒等残差块进行改进实现局部细粒度特征融合,从而减少特征信息丢失,增强对文本区域特征提取力...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号