首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于游长平滑的文档图像倾斜校正   总被引:7,自引:0,他引:7  
图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数字化系统中得到成功应用。  相似文献   

2.
归纳现有的多种倾斜字符校正方法,提出一种基于Radon变换用于一般字符校正的方法。该方法对文本图像做简单的数学形态学处理,利用Radon变换求出文本倾斜的角度。实验结果表明:与传统方法相比,本算法减少了计算量,提高了校正效率,且具有较强的适用性和鲁棒性。  相似文献   

3.
一种改进的中文文档图像倾斜检测方法   总被引:4,自引:0,他引:4  
孙楠  刘志文 《计算机仿真》2006,23(9):184-187
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。  相似文献   

4.
Among the most commonly used compression algorithms for document images are those defined by the Consultative Committee for International Telephone and Telegraph (CCITT). CCITT Group III compression is used in all facsimile transmission by modem over analog telephone lines. CCITT Group IV is used in digital transmission and storage of document images. Sufficient readily interpretable spatial information exists in these compressed document images to enable their characterization. In particular, it is possible to locate the positions of the bottoms of both black and white structures. Using the bottoms of black structures we can determine the peak strength of their alignment in order to determine the dominant skew angle of the image. This method can be expanded, by finding minor peaks, to identify multiple skew angles in single images. The angular distributions of the peak alignments of both white and black structures are assembled to form an alignment signature. Logotypes can be designed which generate distinct alignment signatures that are detectable in the compressed representation.  相似文献   

5.
A Document Skew Detection Method Using the Hough Transform   总被引:4,自引:0,他引:4  
Document image processing has become an increasingly important technology in the automation of office documentation tasks. Automatic document scanners such as text readers and OCR (Optical Character Recognition) systems are an essential component of systems capable of those tasks. One of the problems in this field is that the document to be read is not always placed correctly on a flatbed scanner. This means that the document may be skewed on the scanner bed, resulting in a skewed image. This skew has a detrimental effect on document on document analysis, document understanding, and character segmentation and recognition. Consequently, detecting the skew of a document image and correcting it are important issues in realising a practical document reader. In this paper we describe a new algorithm for skew detection. We then compare the performance and results of this skew detection algorithm to other publidhed methods form O'Gorman, Hinds, Le, Baird, Posel and Akuyama. Finally, we discuss the theory of skew detection and the different apporaches taken to solve the problem of skew in documents. The skew correction algorithm we propose has been shown to be extremenly fast, with run times averaging under 0.25 CPU seconds to calculate the angle on the DEC 5000/20 workstation. Received: 21 November 1998, Received in revised form: 25 August 1999, Accepted: 20 October 1999  相似文献   

6.
基于页面前景和最小二乘法的倾斜校正   总被引:4,自引:0,他引:4       下载免费PDF全文
陈波  王加俊  吴陈 《计算机工程》2007,33(15):202-204
鉴于页面版面复杂,提出了一种基于页面前景和最小二乘法的倾斜校正方法。该方法用特定的模式描述页面前景像素,利用模式粗分类分离页面中可能有的图像、图形和表格,通过合并余下的模式得到最大的文字模式结构体,依据该结构体所含基线特征点用最小二乘法拟合出基线方向即页面倾斜方向。实验表明该方法是有效的,速度快,它得到的模式结构体可以继续用来做版面分析。  相似文献   

7.
一种快速的文本倾斜检测方法   总被引:2,自引:0,他引:2  
文本的倾斜检测是将文本转换成数字形式的过程中的第一步工作,也是很重要的一步工作。因为后续的很多工作都是基于摆正的文本。文章提出了一种全新的倾斜检测与纠正方法。其特点在于:一、与文本的纹理无关,从而适应各种图文混排及各种书写方向并存等复杂情形;二、运算量小,只需进行一次旋转和四次对图像的部分投影。  相似文献   

8.
对于扫描或相机拍摄的低分辨率文本图片,提出一种基于马尔科夫随机场的文本图像清晰化算法.该算法首先引入了马尔科夫随机场模型,然后考虑平衡数据项与平滑项之间的关系从而确定出能量函数的表达式.利用改进过的置信度传播方法来解决马尔科夫随机场中的最大后验估计问题,以达到最小化能量函数的目的.实验结果表明,本算法能够较有效地提高低分辨率图像的清晰度,一定程度上提高了图片的分辨率,尤其对文字的边缘部分有很好的锐化效果.  相似文献   

9.
Thresholding is a common image processing operation applied to gray-scale images to obtain binary or multilevel images. Traditionally, one of two approaches is used: global or locally adaptive processing. However, each of these approaches has a disadvantage: the global approach neglects local information, and the locally adaptive approach neglects global information. A thresholding method is described here that is global in approach, but uses a measure of local information, namely connectivity. Thresholds are found at the intensity levels that best preserve the connectivity of regions within the image. Thus, this method has advantages of both global and locally adaptive approaches. This method is applied here to document images. Experimental comparisons against other thresholding methods show that the connectivity-preserving method yields much improved results. On binary images, this method has been shown to improve subsequent OCR recognition rates from about 95% to 97,5%. More importantly, the new method has been shown to reduce the number of binarization failures (where text is so poorly binarized as to be totally unrecognizable by a commercial OCR system) from 33% to 6% on difficult images. For multilevel document images, as well, the results show similar improvement.  相似文献   

10.
针对基于数码相机拍摄的小型文档图像,提出一种集成型的小型文档图像透视变形校正方法.利用小型文档本身面积小,文字数少,版面较复杂的特点,通过彩色图像分割提取小型文档的外边缘并结合小型文档内部的文字信息进行校正.实验表明,该方法能够有效地对小型文档图像进行快速准确的校正.  相似文献   

11.
纸质文档通过图像获取设备转换为文档图像,由于人为因素和一些其它原因,文档图像不可避免地包含一定的倾斜角度。为了便于计算机处理,有必要对文档图像进行倾斜校正。文档版面十分复杂,包含文字、图像、图形、表格等内容。建立一个较为通用的文档图像倾斜校正算法是很困难的。提出了基于内容的文档倾斜自动校正方法,通过小波变换、游长平滑和细化处理,提取表格中的水平线和垂直线或文字行。针对不同的文档版面采用相应的倾斜校正策略。实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。  相似文献   

12.
提出了一种利用文本背景嵌入水印的文本数字水印新方法.设计了2种不同的地纹模式代表不同的水印信息,同时地纹模式也代表背景图像的灰度,能再现完整的背景图像.接着介绍了水印嵌入和检出的过程.通过从多次复印的文本中提取水印的实验测定了水印的提取率,验证了该水印对复印操作的高鲁棒性.  相似文献   

13.
在对文本扫描输入的过程中,文本图像不可避免地会发生倾斜,倾斜校正将为图文分割、文字识别等后续处理工作创造良好的条件。基于可变模板技术,提出一种新的倾斜检测方法。在构造表征扫描文本的可变模板和定义合适的能量函数的基础上,采用遗传算法进行快速优化搜索。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受倾角大小和文字方向的影响,具有较强的抗噪声性和较快的收敛速度。  相似文献   

14.
一种高效的倾斜图像校正方法   总被引:3,自引:0,他引:3       下载免费PDF全文
李庆峰  付忠良  刘琴 《计算机工程》2006,32(21):194-196
在图像处理系统中,通过采集设备获得的图像不可避免地会出现倾斜现象,这给后续的图像处理和分析带来了困难。因此,倾斜图像的检测和校正是很重要的环节。该文提出了一种新方法,通过一次旋转来得到一条边上的两个点,通过两点就确定了图像的边缘、得到图像的倾斜度。与传统方法相比,该方法不仅计算量小、准确度高,且具有很好的鲁棒性。  相似文献   

15.
基于直线拟合的文本倾斜检测算法   总被引:6,自引:0,他引:6  
在文本扫描输入的过程中,文本图像不可避免地会发生倾斜,而布局分析及字符识别算法对页面倾斜十分敏感,因此倾斜检测和校正是文档分析预处理中的重要环节。提出了一个基于直线拟合的倾斜检测方法,它对文本图像二值化、分块,进行Fourier变换获得Fourier光谱,提取Fourier光谱中反映倾斜角的特征点,然后对特征点进行拟合处理,最后获得页面倾斜角。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受文本布局、行间距以及字体的影响。  相似文献   

16.
多源遥感数据的融合和综合应用必须实行严格的配准,若将通过选取控制点的传统方法,用于成象特性差异较大的图象间配准就存在较大的误差,为解决该问题,研究发展了一种基于分窗口相关的图象配准方法,即采用移动窗灰度相关的方法对图象上的每一点进行搜索,来寻找最大相关位置,以达到精确配准的目的。通过将该方法应用于不同时相的TM图象、SAR图象、不同成象方式和不同分辨率的AVIRIS图象和航片间配准的实验表明,该方法能够有效地实现复杂图象间的精确配准,配准误差已达到子象素级水平。  相似文献   

17.
基于视窗的OCR页面图像倾斜检测方法   总被引:2,自引:0,他引:2       下载免费PDF全文
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。  相似文献   

18.
垃圾邮件制造者采用图像来隐藏垃圾信息,把文字隐藏在图像中并带一定的倾斜。在对含有倾斜文字的图像邮件深入分析后,针对图片中含有倾斜文字的垃圾邮件,文章给出了一种在进行OCR识别之前对图像进行hough变换,并结合支持向量机识别垃圾邮件的算法,实验结果表明,该方法具有比较满意的过滤效果。  相似文献   

19.
基于差分演化算法的MR图像平移运动伪影校正   总被引:1,自引:0,他引:1  
在磁共振(Magnetic resonance,MR)成像过程中,病人的自主运动或生理性运动会使重建的图像产生伪影,严重影响医生的诊断.为了校正MR图像平移运动伪影,本文提出了一种基于差分演化算法的校正方法.首先利用非兴趣区的伪影数据,建立关于K空间偏移相位的约束条件方程组.然后采用差分演化算法搜索最优平移位移量,由此计算出相位偏差量并修正图像.同时提出一个新的价值函数,以此作为演化计算终止的判断条件,实现伪影图像的自动校正.实验结果表明,该算法能够有效地修正含有平移运动伪影的MR图像,且不需要反复的人工掩膜处理.  相似文献   

20.
基于纹理梯度的文档图像的倾斜校正方法   总被引:3,自引:0,他引:3  
文档图像的倾斜校正在光学字符识别以及文档理解系统研究中有着重要的意义,国内外学者提出了很多实现方法,但各种方法都存在一定的局限性.通过对基于Hough变换和投影的倾斜校正方法的分析,提出了一种基于文档图像纹理方向的倾斜校正方法:文档图像中的文本纹理整体表现出一定的方向性,使文本图像能保持水平,通过纹理方向性分析,找出纹理的主要方向,进而求得文档的倾斜角度.通过一个复杂版面的二值文档图像的检测校正实验表明,方法提高了倾斜校正的校正范围,而且具有较好的有效性和鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号