首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
首先阐述了文本定位的基本流程,然后列举了现有的主要文本定位方法,分析了基于区域、纹理、边缘、角点的文本定位方法和机器学习的文本定位方法的优缺点,详细说明了文本区域验证和文本块区域合并的方法,最后总结了各种文本定位方法。  相似文献   

2.
为了准确有效地定位出图像中的维吾尔文本区域,提出了一种基于通道增强最大稳定极值区域(Maximally Stable Extremal Region,MSER)和卷积神经网络(Convolutional Neural Network,CNN)的图像文本区域定位方法。应用通道增强MSER提取候选区域,根据文本特征的启发式规则以及CNN分类结果去除非文本和重复区域,通过区域融合算法得到词级别文本区域,根据该区域的色彩相近程度和空间关系召回遗漏的文本区域,并通过CNN网络对召回的区域分类融合,定位出图像文本区域。实验结果表明,该方法可以准确有效地定位文本区域,具有鲁棒性和应用性。  相似文献   

3.
为了解决视频检索中文本定位精确度不高的问题,提出一种基于条件笔画密度提取的文本定位方法。根据文本笔画的特征对视频图像中的文本进行初步定位,用基于条件密度的方法滤去一部分非文本区域,再利用动态形态学对提取的文本区域精确定位并对其优化得到最终的文本区域。实验结果表明,该方法能滤去大部分非文本信息,得到相对精确的文本区域,并且定位效果较好。  相似文献   

4.
根据对自然场景图像分割后具有标志牌和背景明显分开等特点,提出了一种基于边框删除的标志牌文本提取算法,首先在二值化图像中采用基于边缘检测和投影算法对标志牌区域进行定位,然后采用边框删除算法提取标志牌文本.大量实验结果表明该方法能够准确定位并提取非规则的标志牌文本.  相似文献   

5.
书脊定位是实现图书管理自动化的重要技术,通过对定位分割出的书脊图像进行图像匹配或文本识别获得图书信息,可大大减小图书检索、整理的人力劳动。论文提出了一种基于文本检测的书脊区域粗选方法,首先通过序贯分割算法检测图像中的字符整体区域,然后根据字符宽度和距离将同属于一本书的字符加入相似字符集合,根据集合内的字符中心和字符宽度计算候选书脊区域,最后通过支持向量机分类器精选书脊区域。相比于已有的书脊定位方法,论文算法在光照敏感、相邻书脊颜色对比度敏感、书脊多角度倾斜检测等方面进行了改善,在实验中取得了较好的定位成功率。  相似文献   

6.
针对在背景复杂、视角多变的仪表图像中提取数字区域信息的需求,本文提出一种改进的仪表数字区域定位方法。本文提出的方法主要是对仪表图像的连通域进行检测、分析和筛选,最终确认数字区域。具体方法为首先对光照不均、模糊的图像进行图像灰度化、直方图均衡、图像滤波、图像二值化等方法进行图像预处理。然后采用MSER算法的准确检测数字区域,产生一系列嵌套的最大极值稳定区域(MSER),对这些区域采用区域清理和区域像素拓展进行优化,建立数字候选区域,然后以笔画宽度变换(SWT)作为文本提取的关键特征,实现对文本候选区域的准确筛选,从而最终确定数字区域。  相似文献   

7.
图像中的文本字符存在于杂乱的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等现象会导致背景分离和文本识别困难.为此提出一种基于图像文本区域的图像聚类方法.该方法首先对自然场景图像中已定位的文本区域提取局部特征描述,并使用随机投影方法将局部特征矢量集映射为固定维的特征向量,然后对包含图像文本区域的图像进行聚类.这种方法避免了由图像分割与字符识别带来的困难.实验结果表明,该方法可以对包含文字的自然场景图像有效地进行聚类,聚类的准确率能达到86.66%.  相似文献   

8.
论文介绍了基于像素、区块、区域和图的文本区域定位模型,给出了分层块文本区域定位算法的流程,详细介绍了分块及梯度值的图像边缘提取方法和区块标记、区块聚合过滤的方法.  相似文献   

9.
针对自然场景中标志文本提出一种文本定位算法.在彩色图像边缘提取的基础上,利用形态学文本定位获得备选文本区域,再用神经网络对备选文本区域进行分类,最后提取文本区域文字.该算法既考虑文本的形状边缘信息,又考虑文本的颜色信息,充分利用基于边缘的方法和基于神经网络学习的方法的优点.实验结果表明,提出的文本定位算法具有较高的准确率.  相似文献   

10.
提出一种基于特定颜色分布区域搜索的文本定位方法,利用文字通常呈现为单一的颜色被不同的背景颜色包围的特点,以单一的颜色作为依据,搜索被包围的文本候选区域;然后,在区域合并与分离算法的基础上,利用不变矩特征和支持向量机(SVM)分类器实现候选区域的进一步筛选。与一般基于形状和纹理的方法相比,由于采用了文字颜色的空间分布特征,避开了文本与其他元素的形状和纹理特征交错问题,保证了算法适应性。基于精确区域搜索的不变矩特征提取,降低了分类器的训练难度,使分类器能很好地适应背景和文字尺寸变化以及部分遮挡等复杂情形。实验表明,该方法具有较好的复杂环境适应性和非常高的准确性。  相似文献   

11.
视频和图像文本提取方法综述   总被引:1,自引:0,他引:1  
文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两大步骤。在每个步骤中,分析并比较了现有算法的使用范围及相对优缺点,讨论了图像公用数据库,列举了近些年来图像中文本提取的重要应用,指出了当前研究中存在的问题,展望了视频和场景图像文本提取方法的发展趋势。  相似文献   

12.
提出了一种单目摄像头下定位人眼瞳孔的方法,分为人脸区域检测、人眼区域检测、瞳孔中心定位三个阶段。在人脸区域检测阶段,利用人脸的肤色和唇色在不同色度空间下的特性,结合区域增长的方法分割出人脸区域;在人眼区域检测阶段,利用定位出的人脸区域,根据先验知识缩小搜索区域,再结合遗传算法搜索眼部区域;最后利用圆的几何性质定位瞳孔中心。实验结果证明了本算法在复杂背景和头部偏转情况下的有效性。  相似文献   

13.
针对计算加权角点饱和度方法在文本定位中对非文本角点提取过密或文本角点提取不足的情况容易错误定位的问题,通过运用候选区域块的高宽比(外接矩形高度与宽度之比)、面积比(白色区域面积与外接矩形面积之比)数据作为特征,结合二元线性回归提出了文本定位方程,解决非文本角点过密的问题.运用文本区域块的高宽比比面积比的数值通常出现两极分布的特点,在定位方程中加入常数C1,用来定位文本,数值在两极之间时加入常数C2,定位非文本,实验结果表明本文算法比计算加权角点饱和度方法取得了更好的效果.  相似文献   

14.
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。  相似文献   

15.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

16.
边缘与灰度检测相结合的场景图像文本定位   总被引:1,自引:0,他引:1       下载免费PDF全文
自然场景图像中包含大量的图像和文本信息,其文本字符能够提供重要的语义信息。利用计算机自动检测并识别自然场景中的文本信息,是模式识别和文字信息处理领域重要的研究内容。本文提出一种有效的从场景图像中定位文本的方法,其原理为:首先基于边缘检测进行文本区域粗定位,对定位到的区域进行灰度检测,来确定文本域中的字符位置,其后对所得到的检测区域进行筛选,去掉噪声区域,获取到目标文本域。实验结果表明,本文提出的方法对字体的大小、样式、颜色、以及排布方向具有较强的鲁棒性, 能够准确定位并提取自然场景下的文本信息。  相似文献   

17.
针对新闻视频帧中文本区域的定位提取问题,提出了一种有效的字幕定位提取方法。通过灰度差分和变异灰度直方图对新闻视频帧字幕区域定位,再经改进的二维最大熵阈值方法对分割出的文字区域进行二值化,得到可识别的文字图片。最后对文本定位和OCR识别情况进行了算法对比。实验表明:与传统的投影法和最大熵方法相比,该方法可有效地提高文本定位的查全率和OCR的识别率。  相似文献   

18.
基于颜色散布分析的自然场景文本定位   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有的文本定位方法存在阈值选择困难、计算窗口尺寸敏感、文本特征与非文本特征交错难以区分等问题,提出一种文本定位方法。利用局部颜色散布分析,突出文字和背景的差异,使阈值选择范围更宽松。通过空间颜色散布分析,基于文本和背景颜色的空间分布实现文本的精确定位和分割,避开文本特征分类问题。实验结果表明,该方法适应性较好,准确性较高。  相似文献   

19.
一种视频文本自动定位、跟踪和识别的方法   总被引:3,自引:0,他引:3       下载免费PDF全文
视频数据中的文本能提供重要的语义信息。本文提出了一种视频文本自动定位、跟踪和识别的方法,首先用基于小波和LH检测视频帧文本所在的位置,然后用运动估计的方法,跟踪后继帧文本的位置,再用多帧平均的方法增强文本区域,最后经过二值化处理和连通分量分析,将文本字符送入OCR软件进行识别。实验结果表明,该方法简单易行,能快速地定位和跟踪文本区域,定位精度和识别效果良好。  相似文献   

20.
提出了一种将颜色边缘与SVM相结合的文本定位与提取的方法。首先根据文本的颜色边缘特征进行粗筛选,获得文本候选区;然后使用SVM分类器进行文本与非文本分类,实现文本区域定位与提取。实验表明,该方法取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号