共查询到20条相似文献,搜索用时 68 毫秒
1.
文本定位作为文本识别的基础和前提,对图像深层信息的理解至关重要。针对自然场景下的文本定位受光照、复杂背景等因素影响较大的问题,提出了一种基于多方向边缘检测和自适应特征融合的自然场景文本定位方法。该方法首先将自然场景图像进行三通道八方向的边缘检测;然后 通过启发式规则 对得到的边缘图像进行过滤从而提取出备选文本域,进而对备选文本域进行自适应权值的HOG-LBP特征提取与融合;最后采用支持向量机进行特征分类学习,实现文本定位。实验结果表明,该方法能准确定位自然场景图片的文本区域,对光照和复杂背景具有较强的鲁棒性。 相似文献
2.
基于聚类与边缘检测的自然场景文本提取方法 总被引:1,自引:0,他引:1
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域. 相似文献
3.
论文介绍了基于像素、区块、区域和图的文本区域定位模型,给出了分层块文本区域定位算法的流程,详细介绍了分块及梯度值的图像边缘提取方法和区块标记、区块聚合过滤的方法. 相似文献
4.
戴津 《计算机光盘软件与应用》2013,(18):104-104,106
图片中含有丰富的文字信息,这有利于正确理解图像内容,并对构建基于图片内容进行检索的系统具有重要意义。本文将基于自然场景中的文字特征的文本检测技术,进行了分类分析,并对国内外的研究现状进行了阐述。 相似文献
5.
6.
基于PCNN的灰度图像边缘检测方法 总被引:5,自引:0,他引:5
脉冲耦合神经网络(PCNN)最初由Eckhorn根据猫大脑中视觉皮层神经元的同步脉冲(SynchronousBurst)现象而提出。由于具有一系列良好的特性,PCNN在图像处理、模式识别等领域获得了广泛的应用。文献[6]根据PCNN的传播特性提出了一种利用PCNN检测二值图像边缘的有效方法,但这种方法并不能直接用于对灰度图像的边缘进行检测。由于实际处理的图像大部分为灰度图像,因而其方法的适用性是很有限的。该文提出了一种基于PCNN的灰度图像边缘检测方法,从而直接对256色灰度图像的边缘进行提取,具有较好的适用性。实验结果表明该方法是有效的。 相似文献
7.
8.
提出了一种将颜色边缘与SVM相结合的文本定位与提取的方法。首先根据文本的颜色边缘特征进行粗筛选,获得文本候选区;然后使用SVM分类器进行文本与非文本分类,实现文本区域定位与提取。实验表明,该方法取得了良好的效果。 相似文献
9.
许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和技术发展路线。此外,列举说明了部分主流公开数据集,对比了各个模型方法在代表性数据集上的性能情况。最后总结了目前不同场景数据下的自然场景文本检测、识别及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。 相似文献
10.
首先阐述了文本定位的基本流程,然后列举了现有的主要文本定位方法,分析了基于区域、纹理、边缘、角点的文本定位方法和机器学习的文本定位方法的优缺点,详细说明了文本区域验证和文本块区域合并的方法,最后总结了各种文本定位方法。 相似文献
11.
针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画外边界优劣角变换次数和增强笔画支持像素面积比两种特征。前者分段统计笔画外轮廓角度变换次数;后者计算笔画宽度稳定区域在笔画总面积的占比,用来分别反映笔画角度和宽度变化稳定特性。为降低文本漏检率,采用多通道最大稳定极值区域(maximally stable extremal regions,MSER)检测,合并所有候选区域,提取候选区域的笔画特征和纹理特征,利用支持向量机完成文本和非文本区域分类。在ICDAR2015数据库上,算法的精确率和召回率分别达到79.3%和72.8%,并在一定程度上解决了光照不均和复杂背景的问题。 相似文献
12.
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。 相似文献
13.
14.
传统的蚁群算法应用于图像边缘检测时,会出现边缘不够平滑、受噪声影响大、易收敛于局部等问题。为了提高边缘检测的效果,将灰度梯度与区域灰度均值方法相结合,确定蚂蚁的初始位置和启发矩阵;引入权重因子定义新的概率转移函数,并通过混沌算法和自适应参数进行信息素矩阵的更新,避免过早陷入局部最优。实验结果表明,改进的蚁群算法可以有效减少噪声对边缘检测的影响,并获得更加完整和清晰的图像边缘,取得较好的效果。 相似文献
15.
针对在特殊领域中彩色图像边缘检测,不仅需要准确地检测到目标边缘而且需要去除非目标边缘,提出了一种新的支持向量机多特征彩色图像边缘检测方法.这种方法根据彩色图像边缘的特点,在图像亮度和色度通道上结合像素加权梯度值和像素邻域相关信息构建多维特征向量,通过训练的支持向量机可以准确识别出目标边缘.实验结果表明,该方法比传统边缘检测方法具有更好目标边缘识别能力. 相似文献
16.
Facet模型能够获得准确的图像边缘信息,但运用Facet模型对目标进行分割时,时间复杂度比较高。针对该问题,从CT图像目标特征的角度,将分形维数特征引入Facet模型。首先利用图像边缘分形维数较大的特点,获得大致的边缘候选点,然后对边缘候选点集运用Facet模型进行分割,得到边缘点的准确位置。实验结果表明,该方法不仅能获得准确的边缘,而且提高了处理速度。 相似文献
17.
18.
19.
边缘提取是获取图像特征的基本方法之一,彩色图像提供了比灰度图像更丰富的信息,彩色图像的边缘检测日益受到人们的重视。分析了目前常见的彩色图像边缘检测算法,提出了一种将主轴分析和嵌入置信度相结合的边缘提取算法,通过实验证明,该方法充分利用了图像的彩色信息,能够有效地保护边缘细节,提高检测精度,具有良好的边缘提取效果和边缘连续性。 相似文献