共查询到10条相似文献,搜索用时 62 毫秒
1.
由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别(Optical character recognition,OCR)性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,... 相似文献
2.
《计算机应用与软件》2016,(6)
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。 相似文献
3.
4.
5.
对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。 相似文献
6.
为解决扭曲文本图片光学字符识别率低的问题,提出基于逆向工程的文档图像扭曲恢复算法。用三维扫描仪采集书本三维模型,运用OpenGL库打开obj文件,依次进行基于书籍平面的正向投影和基于离散点坐标值的拉伸校正,对由厚度造成的书籍文字的扭曲现象进行校正,产生展平书页的逆向效果。实验结果表明,该算法可有效提高OCR识别率。 相似文献
7.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于
含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉
线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的
距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距
离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显,
对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。 相似文献
8.
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度, 并与传统方法相比较, 该算法的效率和鲁棒性较高。 相似文献
9.
10.
随着教育技术的发展, 越来越多的人在学习过程中使用PPT文档. 对PPT文档进行概念图的构建, 使得学习者能快速且全面地了解一个PPT文档的知识要点, 有益于学习者加快学习速度, 有益于获取学习者的学习行为. 基于此, 提出了一种利用Microsoft Office编程技术、文本挖掘技术和社会网络分析技术自动提取PPT文档中的概念术语、概念术语之间的关系及构建概念图的算法. 实验结果表明: 该算法可以计算概念术语的重要性; 算法提取的概念术语具有一定的准确率, 提取到的越重要的概念术语的准确率越高. 相似文献