共查询到19条相似文献,搜索用时 62 毫秒
1.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于
含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉
线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的
距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距
离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显,
对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。 相似文献
2.
《计算机应用与软件》2016,(6)
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。 相似文献
3.
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。 相似文献
4.
5.
6.
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度, 并与传统方法相比较, 该算法的效率和鲁棒性较高。 相似文献
7.
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在... 相似文献
8.
文档图像分割的研究对于打印、传真以及这样的数据处理工作具有十分重要的意义 .提出了一个文档图像分割的新算法 .分割算法的特征是基于根据文档图像中各种图像类型直方图的不同特性 .算法中重要的特征是通过小波图像来加强原始图像的特征 ,从而使得精确度提高 相似文献
9.
10.
一种优化的文档图像分割方法 总被引:1,自引:0,他引:1
文档图像在数字图书馆、电子商务以及电子政务等工程中已获得广泛应用。如何对文档图像进行有效的转换、存储和传输,成为人们研究的焦点。将文档图像分割成不同的区域,根据不同区域的特点分别进行处理,成为一种有效的解决方案。本文在传统的块分割和图层分割方法的基础上,提出了一种优化的文档图像分割思路,对这两种方法进行了合理的综合处理,能够取得更好的效果。 相似文献
11.
由于鱼眼相机视场广阔在很多领域都得到了广泛应用,但其图像存在着明显的径向
畸变,需要在应用之前加以校正。为此分析了径向畸变模型解析解的非唯一性;根据径向畸变的
对称性,得出了畸变直线与理想直线之间的关系,即畸变校正的解析表达式;提出了一种鱼眼图
像径向畸变校正的新方法。实验证明,该方法计算简单,能有效校正包含直线特征的场景。 相似文献
12.
13.
14.
15.
16.
针对航摄时拍摄角度倾斜于地面而产生的倾斜影像的几何畸变问题,提出了一种基于空间变换的倾斜影像纠正方法。首先根据坐标转换数学模型和新影像的采样间隔,确定出新影像的大小和原影像在新影像中的坐标域;然后在新影像中判断并统计出在坐标域内的像素点,构成坐标域点集;最后推导了转换模型的反变换,建立了关于原影像图像坐标的线性方程组并进行了改进整理,求解方程组的解并转换成像素坐标后,利用最近邻插值获取到坐标域各点的灰度值,以实现影像的纠正。通过Matlab进行了实验,对倾斜影像纠正效果良好,较一般算法相比耗时更少,该研究提出的算法可用于倾斜影像的配准、拼接和建模等处理。 相似文献
17.
畸变是鱼眼镜头的最大的问题,针对这一情况,提出一种利用双椭圆模型对鱼眼镜头进行畸变校正的算法,在改善鱼眼畸变的情况下,同时能够保障实时输出;对鱼眼图像进行边缘扫描和检测,采用线性拟合的方法获取鱼眼图像的光心和半径,经过双椭圆模型寻找校正前和校正后图像的映射关系,调用GPU加速处理,达到实时输出的效果,经过实验对比,针对鱼眼镜头引起的畸变问题进行校正并且能够实时输出; 相似文献
18.
苗立刚 《中国图象图形学报》2009,14(8):1656-1662
为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。 相似文献