首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别(Optical character recognition,OCR)性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,...  相似文献   

2.
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。  相似文献   

3.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

4.
由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。  相似文献   

5.
彩色文档图像的倾斜自动校正算法   总被引:6,自引:0,他引:6       下载免费PDF全文
对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。  相似文献   

6.
为解决扭曲文本图片光学字符识别率低的问题,提出基于逆向工程的文档图像扭曲恢复算法。用三维扫描仪采集书本三维模型,运用OpenGL库打开obj文件,依次进行基于书籍平面的正向投影和基于离散点坐标值的拉伸校正,对由厚度造成的书籍文字的扭曲现象进行校正,产生展平书页的逆向效果。实验结果表明,该算法可有效提高OCR识别率。  相似文献   

7.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于 含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉 线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的 距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距 离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显, 对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。  相似文献   

8.
宋丽丽  吴亚东  孙波 《计算机应用》2010,30(12):3317-3320
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度, 并与传统方法相比较, 该算法的效率和鲁棒性较高。  相似文献   

9.
文章提出一种基于图像处理的文档图像矫正系统,该系统首先对文档图像进行高斯滤波、局部边缘提取及膨胀操作,然后提取轮廓,最后基于Hough变换算法找到可以覆盖所有轮廓的最小矩形并生成仿射变换矩阵进行变换矫正。该方法相比传统的基于Hough变换的方法,增加基于图像处理的滤波及形态学处理,使矫正效果更好;相比其他常见的基于模式识别进行图像矫正的方法,抗干扰能力更强;相比常见的基于深度学习进行图像矫正的方法,运算速度快,模型小,更适合在智能手机等移动端使用。  相似文献   

10.
随着教育技术的发展, 越来越多的人在学习过程中使用PPT文档. 对PPT文档进行概念图的构建, 使得学习者能快速且全面地了解一个PPT文档的知识要点, 有益于学习者加快学习速度, 有益于获取学习者的学习行为. 基于此, 提出了一种利用Microsoft Office编程技术、文本挖掘技术和社会网络分析技术自动提取PPT文档中的概念术语、概念术语之间的关系及构建概念图的算法. 实验结果表明: 该算法可以计算概念术语的重要性; 算法提取的概念术语具有一定的准确率, 提取到的越重要的概念术语的准确率越高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号