首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

2.
针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。  相似文献   

3.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于 含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉 线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的 距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距 离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显, 对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。  相似文献   

4.
由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。  相似文献   

5.
文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.  相似文献   

6.
针对基于数码相机拍摄的小型文档图像,提出一种集成型的小型文档图像透视变形校正方法.利用小型文档本身面积小,文字数少,版面较复杂的特点,通过彩色图像分割提取小型文档的外边缘并结合小型文档内部的文字信息进行校正.实验表明,该方法能够有效地对小型文档图像进行快速准确的校正.  相似文献   

7.
为解决扭曲文本图片光学字符识别率低的问题,提出基于逆向工程的文档图像扭曲恢复算法。用三维扫描仪采集书本三维模型,运用OpenGL库打开obj文件,依次进行基于书籍平面的正向投影和基于离散点坐标值的拉伸校正,对由厚度造成的书籍文字的扭曲现象进行校正,产生展平书页的逆向效果。实验结果表明,该算法可有效提高OCR识别率。  相似文献   

8.
为解决复杂拍摄背景下采集到的文本图像难以快速、准确地进行倾斜校正的问题,提出一种新的倾斜文本图像校正方法。该方法通过对选定图像的投影窗口的水平投影统计分析计算,自适应地筛选出只含有文字的文本特征子区。在特征子区内部,通过采用连通域横向搜索法定位文字行并拟合直线计算出文本线的倾斜角度,从而得到文本图像的倾斜角度,最后利用改进的快速旋转变换算法进行倾斜校正。实验结果表明,该倾斜校正方法不受成像背景、复杂版面的影响,具有速度快、精度高、适应性强的优点,可广泛应用于对速度和效率有更高要求的移动终端平台上。  相似文献   

9.
介绍了一种基于版面结构距离的文档图像检索算法,使用版面特征作为文档图像的特征检索图像.先将文档图像进行梯度和最大梯度差(MGD)计算,然后使用MGD值作为一个窗口对文本区域进行融合,将文档图像以行线的形式标示出来.同时给出了检索的匹配方法,并对匹配方法进行了实验.实验结果表明,该检索方法具有较高的查准率,具有很好的抗倾斜和抗缩放效果.  相似文献   

10.
纸质文档通过图像获取设备转换为文档图像,由于人为因素和一些其它原因,文档图像不可避免地包含一定的倾斜角度。为了便于计算机处理,有必要对文档图像进行倾斜校正。文档版面十分复杂,包含文字、图像、图形、表格等内容。建立一个较为通用的文档图像倾斜校正算法是很困难的。提出了基于内容的文档倾斜自动校正方法,通过小波变换、游长平滑和细化处理,提取表格中的水平线和垂直线或文字行。针对不同的文档版面采用相应的倾斜校正策略。实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号