共查询到18条相似文献,搜索用时 328 毫秒
1.
新的文本图像倾斜检测及校正算法 总被引:3,自引:0,他引:3
在文档扫描过程中,文档可能会发生倾斜,而很多字符识别和布局分析算法都对倾斜十分敏感,文本图像的倾斜检测及校正就成为文档分析不可缺少的环节.提出了一种新的倾斜文本图像的校正方法,该方法首先获取文档图像的bounding box,以bounding box面积最小作为倾斜校正的最终目标,并使用遗传算法搜索该最小值.实验结果表明,该算法对倾斜角的检测具有较高的精确度. 相似文献
2.
3.
归纳现有的多种倾斜字符校正方法,提出一种基于Radon变换用于一般字符校正的方法。该方法对文本图像做简单的数学形态学处理,利用Radon变换求出文本倾斜的角度。实验结果表明:与传统方法相比,本算法减少了计算量,提高了校正效率,且具有较强的适用性和鲁棒性。 相似文献
4.
5.
6.
在车牌图像的采集过程中,经常会有车牌倾斜的现象发生,这种倾斜给后续的字符分割和字符识别造成了很多不利影响。为此,文中提出了一种基于最小二乘和最小投影距离的车牌倾斜校正方法。该方法将车牌倾斜分成水平倾斜和垂直倾斜两部分:对于水平倾斜,首先对二值化后的车牌去边框和铆钉,再对车牌利用最小二乘拟合直线求取倾斜角;而对于垂直倾斜,则引入分块查找法来降低查找最小投影距离的执行次数,从而提高算法的执行效率。实验结果表明:该算法简单实用,能够准确地对车牌进行校正。 相似文献
7.
票据图像预处理方法的研究 总被引:4,自引:0,他引:4
在文档影像的自动处理中,去黑边和倾斜校正是影像预处理的首要环节.该文提出了变黑边模板的概念和基于区域填充的黑边去除算法.对于图像的倾斜校正,我们提出了基于方向投影的表格线检测方法,并由此实现图像的自动分类;对不含表格线的图像,文中将字符包围盒中心作为特征点,采用Hough变换的算法进行倾斜检测.另外,倾斜检测时还采用金字塔模型降低图像分辨率,进一步提高了算法速度.实验表明,该文的方法能够有效地去除图像黑边,快速准确地检测出图像的倾斜角,并具有很强的抗干扰性和应用适应性. 相似文献
8.
书脊定位是实现图书管理自动化的重要技术,通过对定位分割出的书脊图像进行图像匹配或文本识别获得图书信息,可大大减小图书检索、整理的人力劳动。论文提出了一种基于文本检测的书脊区域粗选方法,首先通过序贯分割算法检测图像中的字符整体区域,然后根据字符宽度和距离将同属于一本书的字符加入相似字符集合,根据集合内的字符中心和字符宽度计算候选书脊区域,最后通过支持向量机分类器精选书脊区域。相比于已有的书脊定位方法,论文算法在光照敏感、相邻书脊颜色对比度敏感、书脊多角度倾斜检测等方面进行了改善,在实验中取得了较好的定位成功率。 相似文献
9.
在手写笔迹识别中,文本行或多或少地存在一定的倾斜,为了减少倾斜的文本行对后续步骤的影响,文章采用水平投影与离散Wigner-Ville分布结合的方法进行笔迹文档整体和局部倾斜矫正.此方法针对手写笔迹图像中存在的倾斜角不一致问题,能够准确完成文本行倾斜角的检测和矫正.在HIT-WM数据库上的实验表明,该方法能有效地矫正手写笔迹中的倾斜文本行. 相似文献
10.
11.
《CVGIP: Graphical Models and Image Processing》1993,55(6):538-543
An efficient algorithm is presented in this paper for correcting skew of text lines in scanned document images. In this method, the cross-correlation between two lines in the image with a fixed distance is calculated. The correlation functions for all pairs of lines in the image are accumulated. The shift for which the accumulated cross-correlation function takes the maximum is then used for determining the skew angle. The image is rotated in the opposite direction for skew correction. The correlation function can be calculated without multiplications for binary images, thus the algorithm can be very efficiently implemented. The method can be used directly for gray-scale and color images as well as binary images. It has been tested on scanned document images with good results. 相似文献
12.
13.
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。 相似文献
14.
Huijie Fan Linlin Zhu Yandong Tang 《International Journal on Document Analysis and Recognition》2010,13(4):261-269
The digitalization processes of documents produce frequently images with small rotation angles. The skew angles in document
images degrade the performance of optical character recognition (OCR) tools. Therefore, skew detection of document images
plays an important role in automatic document analysis systems. In this paper, we propose a Rectangular Active Contour Model
(RAC Model) for content region detection and skew angle calculation by imposing a rectangular shape constraint on the zero-level
set in Chan–Vese Model (C-V Model) according to the rectangular feature of content regions in document images. Our algorithm
differs from other skew detection methods in that it does not rely on local image features. Instead, it uses global image
features and shape constraint to obtain a strong robustness in detecting skew angles of document images. We experimented on
different types of document images. Comparing the results with other skew detection algorithms, our algorithm is more accurate
in detecting the skews of the complex document images with different fonts, tables, illustrations, and layouts. We do not
need to pre-process the original image, even if it is noisy, and at the same time the rectangular content region of a document
image is also detected. 相似文献
15.
目的 在光学字符识别中,文本图像经常会出现一定角度的倾斜.为将倾斜的文本图像校正,以便于字符识别中的后续处理,快速准确地检测倾斜文本图像的倾角是非常重要的.方法 对基于投影轮廓的算法进行改进,提出了一种两级投影直方图方差的算法(TPHV).首先在预定的角度范围内以一定角度步长对选定的图像区域做多方向投影,以获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值,最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影,重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值.结果 该算法能够处理各种复杂的文本图像;对于诸如2 480×3 508像素的较大图像,可在200 ms左右的时间内完成倾角的检测;可检测的倾角范围不受限制;对相关网站提供的5组共500幅测试图像检测误差绝对值均值不超过0.5°,最大值不超过0.7°,检测误差的方差不超过0.1.结论 实验结果表明,该算法具有明显优势:速度快,倾斜角度检测精度高,误差集中,检测范围大,对噪声不敏感,具有广泛的适用性,适合于复杂的排版方式. 相似文献
16.
17.
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。 相似文献
18.
一种改进的中文文档图像倾斜检测方法 总被引:4,自引:0,他引:4
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在Visual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。 相似文献