首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对低质量文档图像受墨迹浸润、页面污渍、背景纹理或光照不均等因素的影响,提出一种基于支持向量机(SVM)的低质量文档图像二值化方法。该方法对文档图像进行分块,并增强每个图像块的局部对比度;利用SVM将这些图像块分成三类,对不同图像类采用不同的阈值处理,实现粗略分割;通过笔画宽度估计确定邻域窗尺寸,从而实现局部精细二值化。实验结果表明,该算法无论从二值化图像质量,还是各种评估参数,较其他经典文档二值化方法都具有明显优势。  相似文献   

2.
针对低质量文档图像存在页面污渍、墨迹浸润、背景纹理等多种退化因素,提出一种融合背景估计与U型卷积神经网络(U-Net)的文档图像二值化算法。该算法首先进行图像对比度增强,然后通过形态学闭操作来估计文档图像背景,并利用全卷积网络,即U-Net对背景减除图像进行前景背景分割,最后采用全局最优阈值处理方法获得最终二值图像。实验结果表明,在2016和2017年国际文档图像二值化竞赛中该算法的◢F值(F◣-measure,FM)、伪◢F◣值(pseudo ◢F◣-measure,p-FM)、峰值信噪比(peak signal to noise ratio,PSNR)、距离倒数失真度量(distance reciprocal distortion,DRD)比性能次优的经典算法最高有5.58%、2.47%、0.86 dB、1.19%的性能提升。  相似文献   

3.
文档图像二值化算法VFCM   总被引:1,自引:0,他引:1  
为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法-VFCM.该算法使用最大方差比方法产生全局阈值,使用FCM(Fuzzy C-Means)聚类方法产生局部阈值.这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影.实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高.  相似文献   

4.
铸件DR图像工件号的增强和分割   总被引:1,自引:0,他引:1       下载免费PDF全文
铸件DR(DigitalRadiography,数字化X射线照相)图像中工件号的识别对提高检测信息录入的自动化程度具有重要意义。由于受铸件厚薄不均等因素的影响,某些铸件DR图像字符区域存在字符与背景区分不明显等问题。要正确识别出铸件的工件号,必须对图像进行处理。采用加性模型消除字符与背景区分不明显的影响,gamma校正调整图像灰度范围,可增强对比度,获得适宜于二值化的增强图像。改进基于二次边缘提取的二值化算法,用于对铸件DR字符图像的二值化,可以减少笔画断裂问题,得到良好的二值化字符图像。字符分割采用小波变换提取图像列和的突变信息,从而确定字符间隔,能够完整地分割出每个字符。对实际的铸件DR图像进行实验表明,研究的方法获得了良好的效果,为铸件DR图像的工件号自动识别做好了准备。  相似文献   

5.
研究图像二值化分割问题。针对模糊或者蜕化文档图像背景与文字融合在一起导致难以区分的难点,提出一种快速有效的两级结构图像分割算法。首先利用迭代算法对图像进行单一阈值分割,在每次迭代过程中以图像均值为依据,对图像进行均衡化处理;在基于全局分割的基础上,在局部范围内根据噪声的统计特性对文档图像进行去噪处理。方法简单高效,实验结果显示该方法能快速地将文档中的文字与背景进行分离,为后续的文档自动化处理提供准确有效的二值化图像。利用该方法,可以方便地拓展到其他类型的二值化处理系统中,例如车牌分割等。  相似文献   

6.
一种基于迭代阈值法的身份证图像二值化算法研究   总被引:12,自引:0,他引:12  
针对身份证扫描图像受激光防伪阴影网格线影响较大的特点,对图像二值化的方法进行了深入分析和研究.提出了一种基于像素邻域特征的迭代阈值方法。该算法模型简单、易于实现.能滤除噪声、使字符笔划清晰地从背景中分割出来.获得了较好的二值化效果。  相似文献   

7.
字符分割效果,直接影响识别精度。在处理亮度不均匀低质量图像中的压印字符时,由于亮度分布不均匀、目标字符与背景区域对比度较低,传统基于二值化图像的字符分割方法在处理上述情况下的压印字符时,难以确定最优二值化阈值,分割准确率较低。提出基于分割效果评价函数的迭代闭环反馈分割方法,通过建立评价函数对分割效果进行评估,以提高分割效率及准确率。借助加权平滑滤波,去除灰度波形图中的畸变波形;并利用广义学习矢量量化算法,确定最优滤波权重因子;通过分析波形变化趋势,确定字符分割位置。实验结果表明,该算法在批量处理亮度不均匀低质量图像中的压印字符时,分割准确率可达98.5%。  相似文献   

8.
识别域图像的提取是文档自动处理系统中一个重要的预处理过程。在实际应用中,用户填写的信息常常与版面中的框线和背景字符存在交叠现象,严重影响了系统的性能。本文提出了基于点边距离分析的背景字符去除算法。首先通过灰度图像匹配的方法精定位背景字符子图像;然后利用形态学方法结合笔画的宽度信息对背景字符子图像进行二值化;最后分析像素点到边界距离的变化确定需要填充的像素位置,并通过形态学方法计算像素的填充值。实验采用了真实票据图像中的日期域,实验结果表明本文的方法获得了基本令人满意的效果,背景字符像素被成功去除。  相似文献   

9.
研究LeNet-5在扫描文档中手写体日期字符识别的应用,由于文档扫描的过程中会引入各种噪声,特别是光照和颜色干扰,直接使用LeNet-5算法不能取得较好效果。先在整份文档中对特定待识别字符的进行定位和划分,并对划分出的字符图像进行去噪、灰度化和二值化处理等预处理,接着将字符图像分割成一个个单个字符,然后在LeNet-5网络基础上结合模型匹配法实现对手写体日期字符的识别。分析在不同参数组合下的识别效果,调整算法模型参数有效地提升了模型对于实际对象的性能,实现出一种能够对手写体日期字符集实现较好识别效果的算法。实验结果表明了算法的有效性,并应用于具体工程实践。  相似文献   

10.
为提高文档图像在对比度低、光照不均、大块噪声等复杂图像背景下二值化效果,提出一种背景估计与边缘检测相结合的图像二值化方法。该方法先利用Sauvola算法有效地估计图像的背景,并在此基础上,结合改进的Canny算法获取边缘变化信息,利用基于局部阈值的策略进行二值化。实验结果表明,该算法取得了较好的二值化效果,在开放的DIBCO 2011数据集上测试,其性能与Otsu、Niblack、Sauvola经典方法相比有大幅提高,其F值比ICDAR2011二值化竞赛中第一名的算法略有提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号