首页 | 本学科首页   官方微博 | 高级检索  
     

基于直线连续性的页面倾斜检测与校正
引用本文:王姝华,李佐,蔡士杰.基于直线连续性的页面倾斜检测与校正[J].计算机辅助设计与图形学学报,2001,13(8):736-741.
作者姓名:王姝华  李佐  蔡士杰
作者单位:南京大学计算机软件新技术国家重点实验室!南京210093
摘    要:在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节,文中提出了一个基于直线连续性的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,计算出基线的方向,即为页面倾斜方向,接着,介绍了一种基于偏移值的倾斜校正方法,实验证明,该算法速度快,准确度高。

关 键 词:文档处理  直线连续性  页面倾斜  检测  校正  计算机  自动处理  字符识别
修稿时间:2000年5月30日

Page Skew Detection and Correction Based on Line Continuity
WANG Shu-Hua,LI Zuo,CAI Shi-Jie.Page Skew Detection and Correction Based on Line Continuity[J].Journal of Computer-Aided Design & Computer Graphics,2001,13(8):736-741.
Authors:WANG Shu-Hua  LI Zuo  CAI Shi-Jie
Abstract:During document scanning, the input document images inevitably introduce skew, while the algorithms for layout analysis and character recognition are every sensitive to page skew. For detecting the page skew, center of the lowest row pixels within each bounding box of connected component is taken as eigen-point. The baseline direction that verifies the page skew can be calculated according to the eigen-points in a text line. Then a correction method based on horizontal and vertical offset is provided. Experiments show that this approach is fast and accurate.
Keywords:document processing  skew detection  skew correction  connected component  eigen-point
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号