首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
图像中的文本字符存在于杂乱的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等现象会导致背景分离和文本识别困难.为此提出一种基于图像文本区域的图像聚类方法.该方法首先对自然场景图像中已定位的文本区域提取局部特征描述,并使用随机投影方法将局部特征矢量集映射为固定维的特征向量,然后对包含图像文本区域的图像进行聚类.这种方法避免了由图像分割与字符识别带来的困难.实验结果表明,该方法可以对包含文字的自然场景图像有效地进行聚类,聚类的准确率能达到86.66%.  相似文献   

2.
自然场景图像中的文本提供了重要的语意信息,它是图像内容的重要来源.针对当前的求解算法普遍存在提取文本精确度不高等缺点,提出了一种文本定位准确的文本提取算法.先将原始图片进行金字塔分解,然后进行彩色图像边缘提取和二值化,再形态学文本定位,最后文本区域字符提取.对ICDAR数据库图片的测试结果表明,该方法对文字颜色、大小字体以及排列方向具有较强的鲁棒性,同时也具有较高的精确度和提取率.  相似文献   

3.
针对光照不均的文本图像在二值化后文字识别率底下的问题,文章提出了一种针对光照不均图像进行二值化和图像增强的算法。针对图像进行分块处理,根据每块自身的平均灰度值和均方差以及全图的平均灰度值来进行算法的自适应变换,已达到对不同光照的区块进行不同处理的目的。实验结果表明本算法能够比较有效的完成对光照不均的文本图像的处理,比单纯的二值化处理方法有一定的提高。  相似文献   

4.
边缘与灰度检测相结合的场景图像文本定位   总被引:1,自引:0,他引:1       下载免费PDF全文
自然场景图像中包含大量的图像和文本信息,其文本字符能够提供重要的语义信息。利用计算机自动检测并识别自然场景中的文本信息,是模式识别和文字信息处理领域重要的研究内容。本文提出一种有效的从场景图像中定位文本的方法,其原理为:首先基于边缘检测进行文本区域粗定位,对定位到的区域进行灰度检测,来确定文本域中的字符位置,其后对所得到的检测区域进行筛选,去掉噪声区域,获取到目标文本域。实验结果表明,本文提出的方法对字体的大小、样式、颜色、以及排布方向具有较强的鲁棒性, 能够准确定位并提取自然场景下的文本信息。  相似文献   

5.
场景文本检测与识别对于自然场景的理解、图像中物体信息的获取以及自动驾驶与导航等研究有非常重要的作用。其中文本字符提取属于场景文本检测与识别的一个分支。在自然场景中,针对当前场景文本图像的不均匀照明等问题,提出一种基于边缘检测和改进的全局自适应文本提取模型结合的文本检测提取方法。首先,对输入的图像先做灰度处理和边缘检测,然后,将文本边缘图像进行二值化和形态学处理,获得候选的字符区域,最后,将其输入到改进的全局自适应文本提取模型中进行分类筛选,从而实现文本字符的检测提取。实验结果表明,该方法具有较好的场景文本字符区域提取能力。  相似文献   

6.
从复杂的自然场景标志牌图像中提取和识别字符一直是数字图像处理领域的热点问题,目前的求解算法普遍存在提取文本精确度不高,提取率偏低,鲁棒性差等缺点。提出一种高效的文本提取算法,针对标志牌文本图像通常具有较复杂的自然背景等特征,首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取,再对边缘图像进行非文本长边缘的删除,最后根据文本区域的特征进行边缘扫描和连通域分析实现标志牌文本的提取。通过对2003年国际自然场景文本识别竞赛(ICDAR’2003 Robust Reading Competition)中大量图片测试表明,该算法对背景的复杂度、文字语言、颜色、大小字体以及排列方向具有较强的鲁棒性,同时也具有较高的准确率(Precision)和提取率(Recall)。  相似文献   

7.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

8.
本文针对车牌字符识别系统在工程应用中存在识别准确率不高、效率低的问题,从工程实践的角度描述了一种新的基于BP神经网络的识别系统在车牌字符识别中的应用。详细介绍了车牌字符识别中的样本集和测试集的组织、图像二值化、归一化、图像去噪、神经网络构建和训练。实践结果表明,本系统适用于自然场景中的车牌自动识别问题,并且具有较强的适应性。  相似文献   

9.
文本图像二值化是光学字符识别的关键步骤,但低质量文本图像背景噪声复杂,且图像全局上下文信息以及深层抽象信息难以获取,使得最终的二值化结果中文字区域分割不精确、文字的形状和轮廓等特征表达不足,从而导致二值化效果不佳。为此,提出一种基于改进U-Net网络的低质量文本图像二值化方法。采用适合小数据集的分割网络U-Net作为骨干模型,选择预训练的VGG16作为U-Net的编码器以提升模型的特征提取能力。通过融合轻量级全局上下文块的U-Net瓶颈层实现特征图的全局上下文建模。在U-Net解码器的各上采样块中融合残差跳跃连接,以提升模型的特征还原能力。从上述编码器、瓶颈层和解码器3个方面分别对U-Net进行改进,从而实现更精确的文本图像二值化。在DIBCO 2016—2018数据集上的实验结果表明,相较Otsu、Sauvola等方法,该方法能够实现更好的去噪效果,其二值化结果中保留了更多的细节特征,文字的形状和轮廓更精确、清晰。  相似文献   

10.
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义。传统的图像文本信息提取方法大多基于字符的代数和几何特征。作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来。提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别。  相似文献   

11.
一种视频中字符的集成型切分与识别算法   总被引:3,自引:0,他引:3  
杨武夷  张树武 《自动化学报》2010,36(10):1468-1476
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率.  相似文献   

12.
图像和视频中包含着丰富的文本信息,提取和识别图像文本信息非常具有实际意义.传统的图像文本信息提取方法大多基于字符的代数和几何特征.作者从另一个角度出发,将彩色字符看成彩色图像的一部分,使类似字符的景物也可以被当作字符识别出来.提出一种基于Mean-Shift算法的图像文本信息提取方法,首先利用Mean-Shift算法对图像进行分割,然后对分割得到的文本区域进行投影分析从而将每个字符分割出来,最后将字符识别.  相似文献   

13.
文本图像的质量对光学字符识别系统的识别性能有着直接的影响,采用边缘定向的双立方插值方法增强图像的边缘信息,可以提高文本图像的识别准确率.上述方法基于图像梯度,利用两个正交方向上的梯度值估计像素的边缘方向,选取合理的阀值估计丢失像素的边缘强度.在强边缘用经典双立方插值插入丢失像素,而在一个弱边缘则由两个正交方向的双立方插值结果相融合为一个丢失的像素插值.使适应不同边缘结构的图像,既能保留图像清晰的边缘也能保留图像纹理细节,产生高分辨率图像.把上述方法应用于光学字符识别的实验结果证明:采用边缘定向的双立方插值方法对图像进行预处理,可以提高光学字符识别准确度,并且识别准确率高于采用其它的传统图像插值方法.  相似文献   

14.
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要.文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别.  相似文献   

15.
针对Tesseract文字识别框架对输入图像的像素要求,以及图像采集过程中可能出现的歪斜、黑边等情况,基于文字识别流程,对预处理阶段的二值化、缩放、边框处理与倾斜矫正进行研究与C++代码的实现.对文字识别OCR(optical character recognition,光学字符识别)的流程进行了概述,重点研究图像缩放...  相似文献   

16.
研究图像去噪优化处理问题,文本图像要预处理.针对使用照相机拍摄的文本图像,如摄像头拍摄的车牌图像,由于其受到采光,相机成像蜕化等方面的约束,使图像分辨率低,图像灰度会分布不均匀或者前后背景灰度差过小.采用传统的图像二值化方法并不能满足识别准确性的需要.为解决上述问题,提出一种对文本图像自适应背景强度补偿的二值化算法.首先通过大模板均值滤波获得对背景强度的初始估计,再利用非线性自适应灰度调整,从而使得最终处理图像能使用简单的全局阈值二值化方法,获得较佳的效果.试验结果表明改进的方法效果明显优于传统算法,大大提高了图像的识别率和准确率.  相似文献   

17.
针对复杂场景下,由于文字背景复杂性而带来的文字定位不准确的问题,提出了一种Radon倾斜校正与MSER(最大稳定极值区域)结合的算法,基于该算法识别出文字在所处复杂背景中的位置。首先,对图像进行预处理,采用Canny算子对图像进行边缘检测,并利用Radon变换对倾斜图像进行校正。然后通过二进小波变换对图像进行增强处理,去除噪声。最后提取MSER,经过粗处理、细处理后,检测出文本所处位置。实验结果表明,基于Radon倾斜校正与MSER结合的方法,能够有效提高文本定位的准确率。  相似文献   

18.
场景文字包含了重要的场景图像的语义信息。因此将场景图像中出现的文字抽取出来,将会对场景图像的内容分析、检索和浏览提供有益的帮助。提出的场景文字提取方法,是在边缘检测的基础上,使用分层块过滤的方法在不同尺度上过滤背景,产生场景文字区域,然后对聚合出来的文字区域根据笔划颜色和笔划宽度方面的特征进行二值化分割得到二值化文字图像,这些二值化后的文字区域图像可以作为OCR引擎的输入进行识别,从而达到提取场景图像语义信息的目的。分层块过滤的方法能较好地过滤背景聚合产生文字区域,利用文字的笔划特征也能有效地分割出文字笔划像素。实验结果也证明了方法的有效性。  相似文献   

19.
基于直线拟合的文本倾斜检测算法   总被引:6,自引:0,他引:6  
在文本扫描输入的过程中,文本图像不可避免地会发生倾斜,而布局分析及字符识别算法对页面倾斜十分敏感,因此倾斜检测和校正是文档分析预处理中的重要环节。提出了一个基于直线拟合的倾斜检测方法,它对文本图像二值化、分块,进行Fourier变换获得Fourier光谱,提取Fourier光谱中反映倾斜角的特征点,然后对特征点进行拟合处理,最后获得页面倾斜角。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受文本布局、行间距以及字体的影响。  相似文献   

20.
场景图像中的文本提供了重要的语义信息,它是图像内容的重要来源。针对当前的求解算法普遍存在提取文本精确度不高等缺点,本文提出了一种有效的文本提取方法。首先对原始图片进行模糊化处理,然后进行Laplacian边缘提取和二值化,再形态学变化,最后进行连通域分析,实现了场景文本的提取。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号