期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2016,(7)

针对低质量文档图像中存在的墨迹浸润、页面污渍或背景纹理等退化因素,提出一种低质量文档图像二值化算法。算法首先基于文档图像的局部对比度实现字符笔画像素检测,然后采用Otsu算法对其进行全局最优阈值化处理,最后通过估计字符笔画宽度确定邻域窗尺寸,从而实现字符前景与页面背景的精细分割。实验结果表明,该算法在F-measure、PSNR、SSIM、NRM、DRD等性能指标方面较其它经典的文档二值化算法具有明显优势。该算法不仅能够较好地保留笔画细节外,还能够较好地抑制文档背景。相似文献

2.

文档图像二值化算法VFCM 总被引：1，自引：0，他引：1

童立靖陈侃付晓玲段建勇《计算机工程与设计》2009,30(13)

为了提高基于拍摄方式的文档图像的二值化效果,降低光学字符识别(optical character recognition,OCR)系统的文字识别错误率,提出了一种全局阈值与局部阈值相结合的二值化算法-VFCM.该算法使用最大方差比方法产生全局阈值,使用FCM(Fuzzy C-Means)聚类方法产生局部阈值.这两种方法的结合能够较好地保留字符的笔画细节,并能有效地消除伪影.实验结果表明,该算法可以取得比较好的二值化效果,并能带来OCR系统识别率的有效提高. 相似文献

3.

基于背景估计和边缘检测的文档图像二值化

《计算机应用与软件》2014,(8)

为提高文档图像在对比度低、光照不均、大块噪声等复杂图像背景下二值化效果,提出一种背景估计与边缘检测相结合的图像二值化方法。该方法先利用Sauvola算法有效地估计图像的背景,并在此基础上,结合改进的Canny算法获取边缘变化信息,利用基于局部阈值的策略进行二值化。实验结果表明,该算法取得了较好的二值化效果,在开放的DIBCO 2011数据集上测试,其性能与Otsu、Niblack、Sauvola经典方法相比有大幅提高,其F值比ICDAR2011二值化竞赛中第一名的算法略有提高。相似文献

4.

基于形态学的图像二值化方法 总被引：2，自引：0，他引：2

邓菁郑永果《计算机工程》2002,28(11):205-206

提出了一种自适应图像二值化方法，它基于数学形态学理论，求取彩色图像边缘特征，并将它与灰度直方图二值化方法相结合，实验表明，这一算法能较好地保留原图像中的特征，二值化后的图像效果不错。相似文献

5.

基于形态学的二值文档图像背景归一化问题研究

杨德强施心陵《计算机科学》2004,31(B07):73-74

对于包含白底黑字和黑底白字两种背景的二值文档图像，要进行后续的文字切分或OCR，首先必须进行背景色的归一化。本文提出了一种采用数学形态学的方法对两种背景进行形态滤波，取出图像的黑色背景区域，再把黑色背景区域在原图中的对应区域反色，实现图像背景归一化。相似文献

6.

背景估计和局部自适应集成的手写图像二值化

何皇兴陈爱国王蛟龙《计算机科学》2022,(11):163-169

手写文档图像中存在光照不均、笔墨浸染、纸张退化、阴影等复杂情况,针对文档图像在复杂背景下二值化后OCR效果不理想的问题,提出了一种对改进的背景估计和局部自适应集成的二值化方法。首先利用局部自适应方法得到具有高召回率的二值化图像,然后对背景估计的方法进行改进得到具有高精确率的二值化图像,最后基于连通域的方法将两种类型的图像集成得到结果。使用4种评价指标在DIBCO2013和DIBCO2016手写数据集上进行了对比实验,结果表明该方法整体性能优于Otsu, Wolf, Niblack, Sauvola, Singh和Howe等经典算法。相似文献

7.

结合背景估计与能量函数的图像二值化算法

熊炜王鑫睿王娟刘敏曾春艳《计算机工程与设计》2019,40(7)

相似文献

8.

机动车牌照图像二值化提取的研究

郭铁桥郑海明《计算机时代》2008,(12)

为了能自动识别机动车牌照,除了车牌区域定位以外,还有一个非常重要的步骤就是要得到一个满意的二值化图像以便字符的分割和识别。文章比较了多种灰度转换算法,归纳出适合我国机动车牌照颜色及搭配特点的算法,在分析全局阈值法和局部阈值法优缺点的基础上,提出了两种方法相结合的图像二值化算法。该算法不仅能较好地保留图像的细节,还能有效地消除伪影的干扰。相似文献

9.

二值化图像的灰度处理算法研究

陈海峰丁丽丽《广东电脑与电讯》2019,(7)

相似文献

10.

基于灰度波动的非均匀光照文档图像二值化

王刘奎史伟民杨亮亮《计算机应用与软件》2020,37(12):197-203

相似文献

11.

基于改进U-Net的低质量文本图像二值化

王红霞何国昌李玉强陈德山《计算机工程》2022,48(4):231-239

文本图像二值化是光学字符识别的关键步骤,但低质量文本图像背景噪声复杂,且图像全局上下文信息以及深层抽象信息难以获取,使得最终的二值化结果中文字区域分割不精确、文字的形状和轮廓等特征表达不足,从而导致二值化效果不佳。为此,提出一种基于改进U-Net网络的低质量文本图像二值化方法。采用适合小数据集的分割网络U-Net作为骨干模型,选择预训练的VGG16作为U-Net的编码器以提升模型的特征提取能力。通过融合轻量级全局上下文块的U-Net瓶颈层实现特征图的全局上下文建模。在U-Net解码器的各上采样块中融合残差跳跃连接,以提升模型的特征还原能力。从上述编码器、瓶颈层和解码器3个方面分别对U-Net进行改进,从而实现更精确的文本图像二值化。在DIBCO 2016—2018数据集上的实验结果表明,相较Otsu、Sauvola等方法,该方法能够实现更好的去噪效果,其二值化结果中保留了更多的细节特征,文字的形状和轮廓更精确、清晰。相似文献

12.

Document image binarization by two-stage block extraction and background intensity determination

Yi-Hong Tseng Hsi-Jian Lee 《Pattern Analysis & Applications》2008,11(1):33-44

This paper presents a novel approach to binarizing document images. All blocks with individual background intensity values in a document image are first extracted using a two-stage extraction procedure. Then, the intensity distribution of each block is calculated to determine the variation ranges of background intensity. For each extracted block, interior pixels whose intensity values fall within these ranges are regarded as background pixels. For those pixels outside all extracted blocks, Otsu’s global threshold method is applied to binarize them. To evaluate the developed system, 275 representative document images are collected to evaluate the binarization results by recognizing characters extracted from those binarized images. These binarized images are generated using the proposed and other existent approaches and fed into the same optical character recognition system to evaluate the practicability of each method. The proposed document binarization method obtains the highest recognition accuracy.

Yi-Hong TsengEmail:

相似文献

13.

基于演化算法的图像二值化算法研究* 总被引：1，自引：0，他引：1

李康顺阮丹丹张文生《计算机应用研究》2012,29(1):348-351

针对传统二值化方法的搜索时间长、图像保真度差等缺陷,利用演化算法具有搜索速度快、图像保真度高、全局寻优等特点,来解决图像二值化阈值难以选取的问题。以车牌图像的二值化为例,针对图像的复杂特征设计出图像演化染色体的编码、交叉、变异等演化操作算子,进而建立求解图像二值化阈值的适应值函数。数据实验表明,与传统的算法相比,利用演化算法求解车牌图像二值化阈值时,其搜索速度快、图像保真度高,能够更有效地进行图像识别和图像处理。相似文献

14.

Document image binarization based on topographic analysis using a water flow model

In-Kwon KimDong-Wook Jung Rae-Hong Park 《Pattern recognition》2002,35(1):265-277

This paper proposes a local adaptive thresholding method based on a water flow model, in which an image surface is considered as a three-dimensional (3-D) terrain. To extract characters from backgrounds, we pour water onto the terrain surface. Water flows down to the lower regions of the terrain and fills valleys. Then, the thresholding process is applied to the amount of filled water for character extraction, in which the proposed thresholding method is applied to gray level document images consisting of characters and backgrounds. The proposed method based on a water flow model shows the property of locally adaptive thresholding. Computer simulation with synthetic and real document images shows that the proposed method yields effective adaptive thresholding results for binarization of document images. 相似文献

15.

Document image binarization using background estimation and stroke edges

Shijian Lu Bolan Su Chew Lim Tan 《International Journal on Document Analysis and Recognition》2010,13(4):303-314

Document images often suffer from different types of degradation that renders the document image binarization a challenging task. This paper presents a document image binarization technique that segments the text from badly degraded document images accurately. The proposed technique is based on the observations that the text documents usually have a document background of the uniform color and texture and the document text within it has a different intensity level compared with the surrounding document background. Given a document image, the proposed technique first estimates a document background surface through an iterative polynomial smoothing procedure. Different types of document degradation are then compensated by using the estimated document background surface. The text stroke edge is further detected from the compensated document image by using L1-norm image gradient. Finally, the document text is segmented by a local threshold that is estimated based on the detected text stroke edges. The proposed technique was submitted to the recent document image binarization contest (DIBCO) held under the framework of ICDAR 2009 and has achieved the top performance among 43 algorithms that are submitted from 35 international research groups. 相似文献

16.

指纹图像的预处理 总被引：1，自引：5，他引：1

余锦华陈建华施心陵《计算机工程与设计》2004,25(12):2210-2212

采用基于方向信息的形态学运算对指纹图像进行预处理。针对指纹图像的特点,首先对图像进行规格化;然后采用分块直方图均衡化方法做一次增强;接着用动态阈值法对图像二值化;根据方向信息对二值图像做基于形态学闭运算的二次增强;最后对二次增强图像细化。给出了一种简单有效的指纹图像预处理方法以及该方法的实验结果。相似文献

17.

多窗口图像二值化算法研究

段锁林朱方严翔《计算机工程与应用》2017,53(17):212-217

常用的全局二值法和局部二值法算法存在细节丢失、噪声引入、运算时间过长等弊端。为此提出了一种多窗口图像二值化算法,采用多窗口模板分别对图像进行简单二值化处理,对不同窗口处理下获得的二值图进行综合判断,最终确定每个像素点的逻辑值。通过MATLAB仿真,与常用二值化算法进行比较,验证提出的多窗口图像二值化算法具有处理简单、运算速度快、鲁棒性较好等优点。相似文献

18.

基于多尺度特征融合双U型皮肤病变分割算法

梁礼明彭仁杰冯骏尹江《计算机应用研究》2021,38(9):2876-2880

针对皮肤病分割问题中皮肤病变区域大小不一且形状各异问题,提出一种基于多尺度特征融合的双U型皮肤病分割算法.该算法由粗分U型网络和细分U型网络两部分组成.首先粗分U型网络编码部分采用预训练VGG-19模型对相关特征进行多尺度特征提取;在解码阶段利用改进注意力残差块将底层与高层信息进行有效的映射融合,得到初步的Mask;然后将初步生成的Mask与原图像聚合,并输入多路特征提取编码器中进行二次特征蒸馏;而细分U型网络解码器同时与粗分U型网络编码部分和细分U型网络的编码部分特征映射进行融合,保证网络可以聚合更多的有效特征;最后利用Focal Tversky损失函数进一步提升分割效果.实验表明,所提算法在ISBI2016数据集上实验分割精度为96.11％、敏感度为93.59％、特异性为97.10％、Dice系数为93.14％、Jaccard系数为87.17％,能够有效地分割皮肤病病变区域. 相似文献

19.

基于几何约束的文本图像倾斜角检测算法

巨志勇王平殿《计算机应用研究》2013,30(3):950-952

针对文本图像倾斜检测的问题, 提出了一种新的基于几何约束的文本图像倾斜角自动检测算法。该算法采用边界标记自动机的方法对一组同行字符轮廓进行检测从而得到该组字符轮廓的最低点信息, 再用矩的方法剔除噪声字符, 并确定页面的倾斜角度。实验结果表明, 该算法在检测效率与准确率上都有了明显的提高, 同时在处理较大倾斜角和较少字符数目的倾斜检测中也有较好的执行效率。因此, 该算法可广泛应用于包括英文、中文、日文在内的多种语言文本图像的倾斜检测中。相似文献

20.

分离复杂背景下的文档图像二值化方法

下载免费PDF全文

王红霞武甲礼陈德山《中国图象图形学报》2023,28(7):2011-2025

目的二值化方法的主要依据是像素的颜色和对比度等低级语义特征，辨别出与文字具有相似低级特征的复杂背景是二值化亟待解决的问题。针对文档图像二值化复杂背景分离问题，提出一种分离文档图像复杂背景的二阶段二值化方法。方法该方法分为易误判像素筛选和二值化分割两个处理阶段，根据两个阶段的分工构建不同结构的两个网络，前者强化对复杂背景中易误判像素识别和分离能力，后者着重文字像素准确预测，以此提升整个二值化方法在复杂背景图像上的处理效果；两个网络各司其职，可在压缩参数量的前提下出色完成各自任务，进一步提高网络效率。同时，为了增强文字目标细节处理能力，提出一种非对称编码—解码结构，给出两种组合方式。结果实验在文本图像二值化比赛（competition on document image binarization，DIBCO）的DIBCO2016、DIBCO2017以及DIBCO2018数据集上与其他方法进行比较，本文方法在DIBCO2018中FM（F-measure）为92.35%，仅比经过特殊预处理的方法差0.17%，综合效果均优于其他方法；在DIBCO2017和DIBCO2016中FM分别为93.46%和92.13%，综合效果在所有方法中最好。实验结果表明，非对称编码—解码结构二值化分割的各项指标均有不同程度的提升。结论提出的二阶段方法能够有效区分复杂背景，进一步提升二值化效果，并在DIBCO数据集上取得了优异成绩。开源代码网址为https://github.com/wjlbnw/Mask_Detail_Net。相似文献