首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 328 毫秒
1.
新的文本图像倾斜检测及校正算法   总被引:3,自引:0,他引:3  
在文档扫描过程中,文档可能会发生倾斜,而很多字符识别和布局分析算法都对倾斜十分敏感,文本图像的倾斜检测及校正就成为文档分析不可缺少的环节.提出了一种新的倾斜文本图像的校正方法,该方法首先获取文档图像的bounding box,以bounding box面积最小作为倾斜校正的最终目标,并使用遗传算法搜索该最小值.实验结果表明,该算法对倾斜角的检测具有较高的精确度.  相似文献   

2.
基于直线拟合的文本倾斜检测算法   总被引:6,自引:0,他引:6  
在文本扫描输入的过程中,文本图像不可避免地会发生倾斜,而布局分析及字符识别算法对页面倾斜十分敏感,因此倾斜检测和校正是文档分析预处理中的重要环节。提出了一个基于直线拟合的倾斜检测方法,它对文本图像二值化、分块,进行Fourier变换获得Fourier光谱,提取Fourier光谱中反映倾斜角的特征点,然后对特征点进行拟合处理,最后获得页面倾斜角。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受文本布局、行间距以及字体的影响。  相似文献   

3.
归纳现有的多种倾斜字符校正方法,提出一种基于Radon变换用于一般字符校正的方法。该方法对文本图像做简单的数学形态学处理,利用Radon变换求出文本倾斜的角度。实验结果表明:与传统方法相比,本算法减少了计算量,提高了校正效率,且具有较强的适用性和鲁棒性。  相似文献   

4.
提出了一种综合边缘检测、投影特征的车牌定位方法和基于垂直投影及模板匹配的字符分割方法,提取车牌灰度图像边缘,实验结果显示该算法检测边缘的速度快,车牌区域轮廓清晰,采用投影法确定车牌区域,用HOUGH变换检测倾斜角度进而对倾斜的车牌进行矫正,通过字符分割算法对车牌字符进行切割,有效地解决了复杂环境的干扰、车牌尺寸变化等问题。对不同背景下的光照车牌进行了大量实验,结果表明该算法能准确地进行车牌定位以及字符分割,具有较好的鲁棒性。  相似文献   

5.
为了加强学生对于基础知识的理解和应用,以文本图像的倾斜角检测为例,提出在教学环节中引进一种不同于传统经典倾斜角检测的算法,即一种基于文本行基线的倾斜角检测算法,阐述此方法和传统方法相比具有的优势,最后说明该方法利于培养学生在学术理论上的创新性。  相似文献   

6.
在车牌图像的采集过程中,经常会有车牌倾斜的现象发生,这种倾斜给后续的字符分割和字符识别造成了很多不利影响。为此,文中提出了一种基于最小二乘和最小投影距离的车牌倾斜校正方法。该方法将车牌倾斜分成水平倾斜和垂直倾斜两部分:对于水平倾斜,首先对二值化后的车牌去边框和铆钉,再对车牌利用最小二乘拟合直线求取倾斜角;而对于垂直倾斜,则引入分块查找法来降低查找最小投影距离的执行次数,从而提高算法的执行效率。实验结果表明:该算法简单实用,能够准确地对车牌进行校正。  相似文献   

7.
票据图像预处理方法的研究   总被引:4,自引:0,他引:4  
张丘  马利庄  高岩  陈志华 《计算机仿真》2005,22(10):208-212
在文档影像的自动处理中,去黑边和倾斜校正是影像预处理的首要环节.该文提出了变黑边模板的概念和基于区域填充的黑边去除算法.对于图像的倾斜校正,我们提出了基于方向投影的表格线检测方法,并由此实现图像的自动分类;对不含表格线的图像,文中将字符包围盒中心作为特征点,采用Hough变换的算法进行倾斜检测.另外,倾斜检测时还采用金字塔模型降低图像分辨率,进一步提高了算法速度.实验表明,该文的方法能够有效地去除图像黑边,快速准确地检测出图像的倾斜角,并具有很强的抗干扰性和应用适应性.  相似文献   

8.
书脊定位是实现图书管理自动化的重要技术,通过对定位分割出的书脊图像进行图像匹配或文本识别获得图书信息,可大大减小图书检索、整理的人力劳动。论文提出了一种基于文本检测的书脊区域粗选方法,首先通过序贯分割算法检测图像中的字符整体区域,然后根据字符宽度和距离将同属于一本书的字符加入相似字符集合,根据集合内的字符中心和字符宽度计算候选书脊区域,最后通过支持向量机分类器精选书脊区域。相比于已有的书脊定位方法,论文算法在光照敏感、相邻书脊颜色对比度敏感、书脊多角度倾斜检测等方面进行了改善,在实验中取得了较好的定位成功率。  相似文献   

9.
在手写笔迹识别中,文本行或多或少地存在一定的倾斜,为了减少倾斜的文本行对后续步骤的影响,文章采用水平投影与离散Wigner-Ville分布结合的方法进行笔迹文档整体和局部倾斜矫正.此方法针对手写笔迹图像中存在的倾斜角不一致问题,能够准确完成文本行倾斜角的检测和矫正.在HIT-WM数据库上的实验表明,该方法能有效地矫正手写笔迹中的倾斜文本行.  相似文献   

10.
针对自然场景图像背景复杂和文本方向不确定的问题,提出一种多方向自然场景文本检测的方法。首先利用颜色增强的最大稳定极值区域(C-MSER)方法对图像中的字符候选区域进行提取,并利用启发式规则和LIBSVM分类器对非字符区域进行消除;然后设计位置颜色模型将被误滤除的字符找回,并利用字符区域中心进行拟合估计文本行倾斜角度;最后通过一个CNN分类器得到精确的结果。该算法在两个标准数据集上(ICDAR2011和ICDAR2013)上进行了测试,f-score分别为0.81和0.82,证明了该方法的有效性。  相似文献   

11.
An efficient algorithm is presented in this paper for correcting skew of text lines in scanned document images. In this method, the cross-correlation between two lines in the image with a fixed distance is calculated. The correlation functions for all pairs of lines in the image are accumulated. The shift for which the accumulated cross-correlation function takes the maximum is then used for determining the skew angle. The image is rotated in the opposite direction for skew correction. The correlation function can be calculated without multiplications for binary images, thus the algorithm can be very efficiently implemented. The method can be used directly for gray-scale and color images as well as binary images. It has been tested on scanned document images with good results.  相似文献   

12.
在对文本扫描输入的过程中,文本图像不可避免地会发生倾斜,倾斜校正将为图文分割、文字识别等后续处理工作创造良好的条件。基于可变模板技术,提出一种新的倾斜检测方法。在构造表征扫描文本的可变模板和定义合适的能量函数的基础上,采用遗传算法进行快速优化搜索。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受倾角大小和文字方向的影响,具有较强的抗噪声性和较快的收敛速度。  相似文献   

13.
基于视窗的OCR页面图像倾斜检测方法   总被引:2,自引:0,他引:2       下载免费PDF全文
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。  相似文献   

14.
The digitalization processes of documents produce frequently images with small rotation angles. The skew angles in document images degrade the performance of optical character recognition (OCR) tools. Therefore, skew detection of document images plays an important role in automatic document analysis systems. In this paper, we propose a Rectangular Active Contour Model (RAC Model) for content region detection and skew angle calculation by imposing a rectangular shape constraint on the zero-level set in Chan–Vese Model (C-V Model) according to the rectangular feature of content regions in document images. Our algorithm differs from other skew detection methods in that it does not rely on local image features. Instead, it uses global image features and shape constraint to obtain a strong robustness in detecting skew angles of document images. We experimented on different types of document images. Comparing the results with other skew detection algorithms, our algorithm is more accurate in detecting the skews of the complex document images with different fonts, tables, illustrations, and layouts. We do not need to pre-process the original image, even if it is noisy, and at the same time the rectangular content region of a document image is also detected.  相似文献   

15.
目的 在光学字符识别中,文本图像经常会出现一定角度的倾斜.为将倾斜的文本图像校正,以便于字符识别中的后续处理,快速准确地检测倾斜文本图像的倾角是非常重要的.方法 对基于投影轮廓的算法进行改进,提出了一种两级投影直方图方差的算法(TPHV).首先在预定的角度范围内以一定角度步长对选定的图像区域做多方向投影,以获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值,最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影,重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值.结果 该算法能够处理各种复杂的文本图像;对于诸如2 480×3 508像素的较大图像,可在200 ms左右的时间内完成倾角的检测;可检测的倾角范围不受限制;对相关网站提供的5组共500幅测试图像检测误差绝对值均值不超过0.5°,最大值不超过0.7°,检测误差的方差不超过0.1.结论 实验结果表明,该算法具有明显优势:速度快,倾斜角度检测精度高,误差集中,检测范围大,对噪声不敏感,具有广泛的适用性,适合于复杂的排版方式.  相似文献   

16.
谢凤英  姜志国  汪雷 《计算机应用》2006,26(7):1587-1589
针对扫描背景不定且含有图表信息的复杂文本图像,提出了一种有效的倾斜检测方法。该方法首先通过对梯度图像的统计分析,自适应地选取到了包含文字的特征子区;在特征子区内,论文把文字行间的空白条带看作一条隐含的线,用优化理论计算出空白条带的倾斜角度,这也就是文本的倾斜角度。实验结果表明,该倾斜检测方法不受扫描背景、边界大小、文本布局及行间距等情况的限制,具有速度快、精度高、适应性强的特点。  相似文献   

17.
基于投影的文档图像倾斜校正方法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。  相似文献   

18.
一种改进的中文文档图像倾斜检测方法   总被引:4,自引:0,他引:4  
孙楠  刘志文 《计算机仿真》2006,23(9):184-187
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号