共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
目的 在光学字符识别中,文本图像经常会出现一定角度的倾斜.为将倾斜的文本图像校正,以便于字符识别中的后续处理,快速准确地检测倾斜文本图像的倾角是非常重要的.方法 对基于投影轮廓的算法进行改进,提出了一种两级投影直方图方差的算法(TPHV).首先在预定的角度范围内以一定角度步长对选定的图像区域做多方向投影,以获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值,最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影,重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值.结果 该算法能够处理各种复杂的文本图像;对于诸如2 480×3 508像素的较大图像,可在200 ms左右的时间内完成倾角的检测;可检测的倾角范围不受限制;对相关网站提供的5组共500幅测试图像检测误差绝对值均值不超过0.5°,最大值不超过0.7°,检测误差的方差不超过0.1.结论 实验结果表明,该算法具有明显优势:速度快,倾斜角度检测精度高,误差集中,检测范围大,对噪声不敏感,具有广泛的适用性,适合于复杂的排版方式. 相似文献
3.
为解决复杂拍摄背景下采集到的文本图像难以快速、准确地进行倾斜校正的问题,提出一种新的倾斜文本图像校正方法。该方法通过对选定图像的投影窗口的水平投影统计分析计算,自适应地筛选出只含有文字的文本特征子区。在特征子区内部,通过采用连通域横向搜索法定位文字行并拟合直线计算出文本线的倾斜角度,从而得到文本图像的倾斜角度,最后利用改进的快速旋转变换算法进行倾斜校正。实验结果表明,该倾斜校正方法不受成像背景、复杂版面的影响,具有速度快、精度高、适应性强的优点,可广泛应用于对速度和效率有更高要求的移动终端平台上。 相似文献
4.
5.
基于最小二乘法的文档图像倾斜检测方法 总被引:9,自引:0,他引:9
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟事出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。 相似文献
6.
7.
新的文本图像倾斜检测及校正算法 总被引:3,自引:0,他引:3
在文档扫描过程中,文档可能会发生倾斜,而很多字符识别和布局分析算法都对倾斜十分敏感,文本图像的倾斜检测及校正就成为文档分析不可缺少的环节.提出了一种新的倾斜文本图像的校正方法,该方法首先获取文档图像的bounding box,以bounding box面积最小作为倾斜校正的最终目标,并使用遗传算法搜索该最小值.实验结果表明,该算法对倾斜角的检测具有较高的精确度. 相似文献
8.
9.
计算机光学乐谱识别技术是将传统的纸质型乐谱转化为计算机能够“读懂”的数字音乐,在计算机音乐领域中具有重要的应用价值、乐谱识别系统的输入是乐谱扫描图像,而扫描过程中出现的图像倾斜现象,会给识别过程中的谱线定位和谱段切割带来诸多困难,必须对图像作有效的倾斜校正以保证系统的性能。为此,提出了一种快速的乐谱图像倾角检测方法。该方法首先利用乐谱文档的自身结构特点,对图像进行预处理,滤除乐谱图像中不具备方向性的干扰像素,然后通过多组图像水平投影队列间的交叉相关性计算对倾角进行检测。其特点是在确保检测倾角精度的同时具有非常高的执行效率。实验结果表明这一方法是有效、实用的。 相似文献
10.
11.
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。 相似文献
12.
基于直线连续性的页面倾斜检测与校正 总被引:14,自引:0,他引:14
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节,文中提出了一个基于直线连续性的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,计算出基线的方向,即为页面倾斜方向,接着,介绍了一种基于偏移值的倾斜校正方法,实验证明,该算法速度快,准确度高。 相似文献
13.
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。 相似文献
14.
15.
针对文本图像倾斜检测的问题, 提出了一种新的基于几何约束的文本图像倾斜角自动检测算法。该算法采用边界标记自动机的方法对一组同行字符轮廓进行检测从而得到该组字符轮廓的最低点信息, 再用矩的方法剔除噪声字符, 并确定页面的倾斜角度。实验结果表明, 该算法在检测效率与准确率上都有了明显的提高, 同时在处理较大倾斜角和较少字符数目的倾斜检测中也有较好的执行效率。因此, 该算法可广泛应用于包括英文、中文、日文在内的多种语言文本图像的倾斜检测中。 相似文献
16.
In the digital world, a wide range of handwritten and printed documents should be converted to digital format using a variety of tools, including mobile phones and scanners. Unfortunately, this is not an optimal procedure, and the entire document image might be degraded. Imperfect conversion effects due to noise, motion blur, and skew distortion can lead to significant impact on the accuracy and effectiveness of document image segmentation and analysis in Optical Character Recognition (OCR) systems. In Document Image Analysis Systems (DIAS), skew estimation of images is a crucial step. In this paper, a novel, fast, and reliable skew detection algorithm based on the Radon Transform and Curve Length Fitness Function (CLF), so-called Radon CLF, was proposed. The Radon CLF model aims to take advantage of the properties of Radon spaces. The Radon CLF explores the dominating angle more effectively for a 1D signal than it does for a 2D input image due to an innovative fitness function formulation for a projected signal of the Radon space. Several significant performance indicators, including Mean Square Error (MSE), Mean Absolute Error (MAE), Peak Signal-to-Noise Ratio (PSNR), Structural Similarity Measure (SSIM), Accuracy, and run-time, were taken into consideration when assessing the performance of our model. In addition, a new dataset named DSI5000 was constructed to assess the accuracy of the CLF model. Both two- dimensional image signal and the Radon space have been used in our simulations to compare the noise effect. Obtained results show that the proposed method is more effective than other approaches already in use, with an accuracy of roughly 99.87% and a run-time of 0.048 (s). The introduced model is far more accurate and time-efficient than current approaches in detecting image skew. 相似文献
17.
18.
本算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线:并由此获得所需的角度值。这一算法也可以用于快速检测其它影像中较长的直线段。 相似文献