期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

汪同庆朱永权王洪《计算机工程》2004,30(1):141-143

图像获取设备将纸质文档转换为文档图像时，文档图像不可避免地存在一定的倾斜。目前，对于倾斜文档图像的处理仍然存在许多困难，因此有必要对倾斜的文档图像进行倾斜校正。但是文档版面十分复杂，包含文字、图像、图形和表格等内容，所以文档图像倾斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法，实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数字化系统中得到成功应用。相似文献

2.

基于最优坐标系的表格版面分析

吕亚军陈继荣《计算机仿真》2007,24(4):211-215

表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义.表格文档版面结构提取是文档信息处理自动化的核心.由于表格文档图像包含印刷体和手写体字符、图像、污损、噪声和一定的倾斜,在其影响下,正确的提取文档的版面结构是比较困难的.在总结国内外表格文档版面结构提取方法的基础上,提出了一种基于最优坐标系的版面结构提取方法,该方法与其它方法相比具有很强的抗干扰能力和文档版面定义灵活方便的特点. 相似文献

3.

一种复杂版面扭曲文档图像快速校正方法

《计算机应用与软件》2016,(6)

在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。相似文献

4.

基于纹理梯度的文档图像的倾斜校正方法 总被引：3，自引：0，他引：3

夏波涌童悍操《计算机仿真》2009,26(3)

文档图像的倾斜校正在光学字符识别以及文档理解系统研究中有着重要的意义,国内外学者提出了很多实现方法,但各种方法都存在一定的局限性.通过对基于Hough变换和投影的倾斜校正方法的分析,提出了一种基于文档图像纹理方向的倾斜校正方法:文档图像中的文本纹理整体表现出一定的方向性,使文本图像能保持水平,通过纹理方向性分析,找出纹理的主要方向,进而求得文档的倾斜角度.通过一个复杂版面的二值文档图像的检测校正实验表明,方法提高了倾斜校正的校正范围,而且具有较好的有效性和鲁棒性. 相似文献

5.

一种集成的小型文档图像透视变形校正方法

马懿超戴汝为王春恒《模式识别与人工智能》2006,19(4)

针对基于数码相机拍摄的小型文档图像,提出一种集成型的小型文档图像透视变形校正方法.利用小型文档本身面积小,文字数少,版面较复杂的特点,通过彩色图像分割提取小型文档的外边缘并结合小型文档内部的文字信息进行校正.实验表明,该方法能够有效地对小型文档图像进行快速准确的校正. 相似文献

6.

Hough变换在中文名片图像倾斜校正中的应用 总被引：15，自引：0，他引：15

潘武模焦扬王庆人《中文信息学报》2001,15(3):51-57

近来,文档图像的计算机自动理解已取得很多进展。但是,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片版面复杂,名片中文字行以及每行字符较少,使得现有的倾斜校正算法在处理名片图像时效果很不理想。Hough变换可用于一般文档图像的倾斜校正。但是,Hough变换在名片图像中的应用还有待研究。本文提出一种二级Hough变换算法,并应用于名片图像理解系统,利用名片图像自身的特点提高Hough变换的精确度和速度。这一方法的效果已被实验结果所证实。相似文献

7.

彩色文档图像的倾斜自动校正算法 总被引：6，自引：0，他引：6

下载免费PDF全文

何希平李云峰朱庆生《中国图象图形学报》2006,11(3):367-371

对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。相似文献

8.

基于页面前景和最小二乘法的倾斜校正 总被引：4，自引：0，他引：4

下载免费PDF全文

陈波王加俊吴陈《计算机工程》2007,33(15):202-204

鉴于页面版面复杂，提出了一种基于页面前景和最小二乘法的倾斜校正方法。该方法用特定的模式描述页面前景像素，利用模式粗分类分离页面中可能有的图像、图形和表格，通过合并余下的模式得到最大的文字模式结构体，依据该结构体所含基线特征点用最小二乘法拟合出基线方向即页面倾斜方向。实验表明该方法是有效的，速度快，它得到的模式结构体可以继续用来做版面分析。相似文献

9.

一种快速文本图像倾斜校正方法

曾凡锋吴飞飞肖珂王晓《计算机应用与软件》2015,(4)

为解决复杂拍摄背景下采集到的文本图像难以快速、准确地进行倾斜校正的问题,提出一种新的倾斜文本图像校正方法。该方法通过对选定图像的投影窗口的水平投影统计分析计算,自适应地筛选出只含有文字的文本特征子区。在特征子区内部,通过采用连通域横向搜索法定位文字行并拟合直线计算出文本线的倾斜角度,从而得到文本图像的倾斜角度,最后利用改进的快速旋转变换算法进行倾斜校正。实验结果表明,该倾斜校正方法不受成像背景、复杂版面的影响,具有速度快、精度高、适应性强的优点,可广泛应用于对速度和效率有更高要求的移动终端平台上。相似文献

10.

RTF文件格式在文档版面重构中的应用 总被引：3，自引：1，他引：3

王宇《计算机应用》2002,22(12):74-75,79

文档版面重构是文字识别系统中的重要组成部分，它在电子出版等领域有着特殊意义。RTF格式是一种可编程的通用文本、图像信息交换格式。本文介绍利用RTF格式实现文档版面重构，特别是表格重构的方法。相似文献

11.

Text segmentation using gabor filters for automatic document processing 总被引：24，自引：0，他引：24

Anil K. Jain Sushil Bhattacharjee 《Machine Vision and Applications》1992,5(3):169-184

There is a considerable interest in designing automatic systems that will scan a given paper document and store it on electronic media for easier storage, manipulation, and access. Most documents contain graphics and images in addition to text. Thus, the document image has to be segmented to identify the text regions, so that OCR techniques may be applied only to those regions. In this paper, we present a simple method for document image segmentation in which text regions in a given document image are automatically identified. The proposed segmentation method for document images is based on a multichannel filtering approach to texture segmentation. The text in the document is considered as a textured region. Nontext contents in the document, such as blank spaces, graphics, and pictures, are considered as regions with different textures. Thus, the problem of segmenting document images into text and nontext regions can be posed as a texture segmentation problem. Two-dimensional Gabor filters are used to extract texture features for each of these regions. These filters have been extensively used earlier for a variety of texture segmentation tasks. Here we apply the same filters to the document image segmentation problem. Our segmentation method does not assume any a priori knowledge about the content or font styles of the document, and is shown to work even for skewed images and handwritten text. Results of the proposed segmentation method are presented for several test images which demonstrate the robustness of this technique. This work was supported by the National Science Foundation under NSF grant CDA-88-06599 and by a grant from E. 1. Du Pont De Nemours & Company. 相似文献

12.

改进的文档图像扭曲校正方法

下载免费PDF全文

宋丽丽吴亚东孙波《计算机工程》2011,37(1):204-206

由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。相似文献

13.

一种改进的中文文档图像倾斜检测方法 总被引：4，自引：0，他引：4

孙楠刘志文《计算机仿真》2006,23(9):184-187

图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C＋＋下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。相似文献

14.

基于视窗的OCR页面图像倾斜检测方法 总被引：2，自引：0，他引：2

下载免费PDF全文

靳从魏之来杨静宇《中国图象图形学报》2004,9(11):1290-1293

文档在扫描输入过程中，所生成的页面图像一般都存在一定的角度倾斜，当页面图像倾斜角度过大时，将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量，提出了一种基于视窗变换的页面图像倾斜检测方法，该算法首先对视窗中的文字及图片的细节部分进行模糊，然后对其边沿进行直线拟合，以便快速检测页面图像倾斜角度。实验结果表明，该方法能快速准确地检测出各类页面图像的倾斜角度，并具有良好的适应性。相似文献

15.

中英文混排扭曲文本图像快速校正方法

下载免费PDF全文

王景中孙婷童立靖《图学学报》2015,36(6):920

针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。相似文献

16.

Document Image Recognition based on template matching of component block projections 总被引：1，自引：0，他引：1

《IEEE transactions on pattern analysis and machine intelligence》2003,25(9):1188-1192

Document Image Recognition (DIR), a very useful technique in office automation and digital library applications, is to find the most similar template for any input document image in a prestored template document image data set. Existing methods use both local features and global layout information. In this paper, we propose a novel algorithm based on the global matching of Component Block Projections (CBP), which are the concatenated directional projection vectors of the component blocks of a document image. Compared to those existing methods, CBP-based template-matching methods possess two major advantages: (1) The spatial relationship among the component blocks of a document image is better represented, hence a very high matching accuracy can be obtained even for a large template set and seriously distorted input images; and (2) the effective matching distance of each template and the triangle inequality are proposed to significantly reduce the computational cost. Our experimental results confirm these advantages and show that the CBP-based template-matching methods are very suitable for DIR applications. 相似文献

17.

基于三维边缘重构的文档图像自动矫正方法

刘婀娜刘一斐祁建芳《计算机应用研究》2007,24(7):315-317

针对照相机对装订书籍拍照时由于书面弯曲产生文档图像变形的问题,利用从图像中提取的文档边缘作为特征信息,通过参数控制自动实现文档图像的矫正.与以往研究成果相比,本方法无须人工标记及特殊设备,具有一定的优越性.实验结果能够有效地对变形文档图像进行矫正. 相似文献

18.

基于Radon变换的倾斜车牌图像角度检测与校正 总被引：1，自引：0，他引：1

孙东卫朱程辉《微计算机应用》2008,29(2):18-21

倾斜车牌图像的校正对于后续车牌图像的分割与识别具有很大的影响.本文提出一种基于Radon变换来估计倾斜角度的方法,并对之实行分步校正,最后应用数学形态学的方法对图像进行平滑处理. 相似文献

19.

Skew Correction of Document Images Using Interline Cross-Correlation

《CVGIP: Graphical Models and Image Processing》1993,55(6):538-543

An efficient algorithm is presented in this paper for correcting skew of text lines in scanned document images. In this method, the cross-correlation between two lines in the image with a fixed distance is calculated. The correlation functions for all pairs of lines in the image are accumulated. The shift for which the accumulated cross-correlation function takes the maximum is then used for determining the skew angle. The image is rotated in the opposite direction for skew correction. The correlation function can be calculated without multiplications for binary images, thus the algorithm can be very efficiently implemented. The method can be used directly for gray-scale and color images as well as binary images. It has been tested on scanned document images with good results. 相似文献