首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
彩色文档图像的倾斜自动校正算法   总被引:6,自引:0,他引:6       下载免费PDF全文
对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。  相似文献   

2.
张吉玲  王希常  刘江 《福建电脑》2008,(3):100-100,104
文档图像处理技术已取得很多进展,但是,对于倾斜图像的理解还存在困难。本文对文档图像的倾斜校正进行了研究,根据文档图像的结构特征,给出了基于数学形态学和投影方差相结合的算法,先使用数学形态学进行形态学运算,强化文档图像地结构特征,再使用细化算法,保证投影方差的准确性,最后使用投影方差,进行文档图像的倾斜校正。实验表明,本文提出的算法可以有效的应用于文档图像的倾斜校正。  相似文献   

3.
新的文本图像倾斜检测及校正算法   总被引:3,自引:0,他引:3  
在文档扫描过程中,文档可能会发生倾斜,而很多字符识别和布局分析算法都对倾斜十分敏感,文本图像的倾斜检测及校正就成为文档分析不可缺少的环节.提出了一种新的倾斜文本图像的校正方法,该方法首先获取文档图像的bounding box,以bounding box面积最小作为倾斜校正的最终目标,并使用遗传算法搜索该最小值.实验结果表明,该算法对倾斜角的检测具有较高的精确度.  相似文献   

4.
纸质文档通过图像获取设备转换为文档图像,由于人为因素和一些其它原因,文档图像不可避免地包含一定的倾斜角度。为了便于计算机处理,有必要对文档图像进行倾斜校正。文档版面十分复杂,包含文字、图像、图形、表格等内容。建立一个较为通用的文档图像倾斜校正算法是很困难的。提出了基于内容的文档倾斜自动校正方法,通过小波变换、游长平滑和细化处理,提取表格中的水平线和垂直线或文字行。针对不同的文档版面采用相应的倾斜校正策略。实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。  相似文献   

5.
基于纹理梯度的文档图像的倾斜校正方法   总被引:3,自引:0,他引:3  
文档图像的倾斜校正在光学字符识别以及文档理解系统研究中有着重要的意义,国内外学者提出了很多实现方法,但各种方法都存在一定的局限性.通过对基于Hough变换和投影的倾斜校正方法的分析,提出了一种基于文档图像纹理方向的倾斜校正方法:文档图像中的文本纹理整体表现出一定的方向性,使文本图像能保持水平,通过纹理方向性分析,找出纹理的主要方向,进而求得文档的倾斜角度.通过一个复杂版面的二值文档图像的检测校正实验表明,方法提高了倾斜校正的校正范围,而且具有较好的有效性和鲁棒性.  相似文献   

6.
基于游长平滑的文档图像倾斜校正   总被引:7,自引:0,他引:7  
图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数字化系统中得到成功应用。  相似文献   

7.
票据图像预处理方法的研究   总被引:4,自引:0,他引:4  
张丘  马利庄  高岩  陈志华 《计算机仿真》2005,22(10):208-212
在文档影像的自动处理中,去黑边和倾斜校正是影像预处理的首要环节.该文提出了变黑边模板的概念和基于区域填充的黑边去除算法.对于图像的倾斜校正,我们提出了基于方向投影的表格线检测方法,并由此实现图像的自动分类;对不含表格线的图像,文中将字符包围盒中心作为特征点,采用Hough变换的算法进行倾斜检测.另外,倾斜检测时还采用金字塔模型降低图像分辨率,进一步提高了算法速度.实验表明,该文的方法能够有效地去除图像黑边,快速准确地检测出图像的倾斜角,并具有很强的抗干扰性和应用适应性.  相似文献   

8.
基于最小二乘法的文档图像倾斜检测方法   总被引:9,自引:0,他引:9  
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟事出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。  相似文献   

9.
基于直线连续性的页面倾斜检测与校正   总被引:14,自引:0,他引:14  
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节,文中提出了一个基于直线连续性的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,计算出基线的方向,即为页面倾斜方向,接着,介绍了一种基于偏移值的倾斜校正方法,实验证明,该算法速度快,准确度高。  相似文献   

10.
Hough变换在中文名片图像倾斜校正中的应用   总被引:15,自引:0,他引:15  
近来,文档图像的计算机自动理解已取得很多进展。但是,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片版面复杂,名片中文字行以及每行字符较少,使得现有的倾斜校正算法在处理名片图像时效果很不理想。Hough变换可用于一般文档图像的倾斜校正。但是,Hough变换在名片图像中的应用还有待研究。本文提出一种二级Hough变换算法,并应用于名片图像理解系统,利用名片图像自身的特点提高Hough变换的精确度和速度。这一方法的效果已被实验结果所证实。  相似文献   

11.
The digitalization processes of documents produce frequently images with small rotation angles. The skew angles in document images degrade the performance of optical character recognition (OCR) tools. Therefore, skew detection of document images plays an important role in automatic document analysis systems. In this paper, we propose a Rectangular Active Contour Model (RAC Model) for content region detection and skew angle calculation by imposing a rectangular shape constraint on the zero-level set in Chan–Vese Model (C-V Model) according to the rectangular feature of content regions in document images. Our algorithm differs from other skew detection methods in that it does not rely on local image features. Instead, it uses global image features and shape constraint to obtain a strong robustness in detecting skew angles of document images. We experimented on different types of document images. Comparing the results with other skew detection algorithms, our algorithm is more accurate in detecting the skews of the complex document images with different fonts, tables, illustrations, and layouts. We do not need to pre-process the original image, even if it is noisy, and at the same time the rectangular content region of a document image is also detected.  相似文献   

12.
针对文本图像倾斜检测的问题, 提出了一种新的基于几何约束的文本图像倾斜角自动检测算法。该算法采用边界标记自动机的方法对一组同行字符轮廓进行检测从而得到该组字符轮廓的最低点信息, 再用矩的方法剔除噪声字符, 并确定页面的倾斜角度。实验结果表明, 该算法在检测效率与准确率上都有了明显的提高, 同时在处理较大倾斜角和较少字符数目的倾斜检测中也有较好的执行效率。因此, 该算法可广泛应用于包括英文、中文、日文在内的多种语言文本图像的倾斜检测中。  相似文献   

13.
A Document Skew Detection Method Using the Hough Transform   总被引:4,自引:0,他引:4  
Document image processing has become an increasingly important technology in the automation of office documentation tasks. Automatic document scanners such as text readers and OCR (Optical Character Recognition) systems are an essential component of systems capable of those tasks. One of the problems in this field is that the document to be read is not always placed correctly on a flatbed scanner. This means that the document may be skewed on the scanner bed, resulting in a skewed image. This skew has a detrimental effect on document on document analysis, document understanding, and character segmentation and recognition. Consequently, detecting the skew of a document image and correcting it are important issues in realising a practical document reader. In this paper we describe a new algorithm for skew detection. We then compare the performance and results of this skew detection algorithm to other publidhed methods form O'Gorman, Hinds, Le, Baird, Posel and Akuyama. Finally, we discuss the theory of skew detection and the different apporaches taken to solve the problem of skew in documents. The skew correction algorithm we propose has been shown to be extremenly fast, with run times averaging under 0.25 CPU seconds to calculate the angle on the DEC 5000/20 workstation. Received: 21 November 1998, Received in revised form: 25 August 1999, Accepted: 20 October 1999  相似文献   

14.
基于投影的文档图像倾斜校正方法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。  相似文献   

15.
一种改进的中文文档图像倾斜检测方法   总被引:4,自引:0,他引:4  
孙楠  刘志文 《计算机仿真》2006,23(9):184-187
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。  相似文献   

16.
在对文本扫描输入的过程中,文本图像不可避免地会发生倾斜,倾斜校正将为图文分割、文字识别等后续处理工作创造良好的条件。基于可变模板技术,提出一种新的倾斜检测方法。在构造表征扫描文本的可变模板和定义合适的能量函数的基础上,采用遗传算法进行快速优化搜索。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受倾角大小和文字方向的影响,具有较强的抗噪声性和较快的收敛速度。  相似文献   

17.
谢凤英  姜志国  汪雷 《计算机应用》2006,26(7):1587-1589
针对扫描背景不定且含有图表信息的复杂文本图像,提出了一种有效的倾斜检测方法。该方法首先通过对梯度图像的统计分析,自适应地选取到了包含文字的特征子区;在特征子区内,论文把文字行间的空白条带看作一条隐含的线,用优化理论计算出空白条带的倾斜角度,这也就是文本的倾斜角度。实验结果表明,该倾斜检测方法不受扫描背景、边界大小、文本布局及行间距等情况的限制,具有速度快、精度高、适应性强的特点。  相似文献   

18.
19.
An efficient algorithm is presented in this paper for correcting skew of text lines in scanned document images. In this method, the cross-correlation between two lines in the image with a fixed distance is calculated. The correlation functions for all pairs of lines in the image are accumulated. The shift for which the accumulated cross-correlation function takes the maximum is then used for determining the skew angle. The image is rotated in the opposite direction for skew correction. The correlation function can be calculated without multiplications for binary images, thus the algorithm can be very efficiently implemented. The method can be used directly for gray-scale and color images as well as binary images. It has been tested on scanned document images with good results.  相似文献   

20.
计算机光学乐谱识别技术是将传统的纸质型乐谱转化为计算机能够“读懂”的数字音乐,在计算机音乐领域中具有重要的应用价值、乐谱识别系统的输入是乐谱扫描图像,而扫描过程中出现的图像倾斜现象,会给识别过程中的谱线定位和谱段切割带来诸多困难,必须对图像作有效的倾斜校正以保证系统的性能。为此,提出了一种快速的乐谱图像倾角检测方法。该方法首先利用乐谱文档的自身结构特点,对图像进行预处理,滤除乐谱图像中不具备方向性的干扰像素,然后通过多组图像水平投影队列间的交叉相关性计算对倾角进行检测。其特点是在确保检测倾角精度的同时具有非常高的执行效率。实验结果表明这一方法是有效、实用的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号