首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于 含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉 线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的 距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距 离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显, 对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。  相似文献   

2.
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。  相似文献   

3.
基于投影的文档图像倾斜校正方法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。  相似文献   

4.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

5.
基于游长平滑的文档图像倾斜校正   总被引:7,自引:0,他引:7  
图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数字化系统中得到成功应用。  相似文献   

6.
宋丽丽  吴亚东  孙波 《计算机应用》2010,30(12):3317-3320
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度, 并与传统方法相比较, 该算法的效率和鲁棒性较高。  相似文献   

7.
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在...  相似文献   

8.
文档图像分割的研究对于打印、传真以及这样的数据处理工作具有十分重要的意义 .提出了一个文档图像分割的新算法 .分割算法的特征是基于根据文档图像中各种图像类型直方图的不同特性 .算法中重要的特征是通过小波图像来加强原始图像的特征 ,从而使得精确度提高  相似文献   

9.
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要.文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别.  相似文献   

10.
一种优化的文档图像分割方法   总被引:1,自引:0,他引:1  
文档图像在数字图书馆、电子商务以及电子政务等工程中已获得广泛应用。如何对文档图像进行有效的转换、存储和传输,成为人们研究的焦点。将文档图像分割成不同的区域,根据不同区域的特点分别进行处理,成为一种有效的解决方案。本文在传统的块分割和图层分割方法的基础上,提出了一种优化的文档图像分割思路,对这两种方法进行了合理的综合处理,能够取得更好的效果。  相似文献   

11.
师平 《图学学报》2016,37(6):805
由于鱼眼相机视场广阔在很多领域都得到了广泛应用,但其图像存在着明显的径向 畸变,需要在应用之前加以校正。为此分析了径向畸变模型解析解的非唯一性;根据径向畸变的 对称性,得出了畸变直线与理想直线之间的关系,即畸变校正的解析表达式;提出了一种鱼眼图 像径向畸变校正的新方法。实验证明,该方法计算简单,能有效校正包含直线特征的场景。  相似文献   

12.
张帆  蒙水金  彭中伟 《计算机工程》2012,38(22):198-200
针对图像液位检测系统中摄像头引入的图像畸变,提出一种基于图像平面的校正方法。使用虚拟的标准校正图代替实际图,通过二阶径向模型的反复迭代求取畸变系数,利用双线性插值对输出像素点灰度进行插补。实验结果表明,该方法的校正误差小于0.35个像素点,能有效提高视频检测精度。  相似文献   

13.
针对文档表面易发生弯曲变形从而影响文档图像识别率这一问题,通过建模恢复文档表面形状,并运用参数化插值的方法实现了变形文档图像的矫正。本文讨论了基本理论及方法,并对算法的设计及实验中开发的平台进行了介绍,实验数据表明本方法可以有效的实现文档图像的矫正。  相似文献   

14.
遥操作中采用全局摄像机对机器人进行定位时存在图像畸变带来的误差,针对这一问题提出了一种图像畸变校正方法.该方法采用径向基神经网络(RBFNN)进行畸变校正.从而获得机器人在实际空间中的坐标位置.实验表明,该方法简单有效,适用于广角镜头带来的图像畸变校正.可以满足利用定位坐标进行路径规划的要求.  相似文献   

15.
图像畸变的矫正是图像处理领域的难题之一,尤其是在自动化检测领域.本文采用一种多项式畸变成像模型建立坐标系之间的转换关系,然后基于LabView平台使用校准点阵进行机器视觉系统校准,并在不同的工作模式下采用双线性插值算法对图像进行矫正.实验结果表明,采集的图像得到了良好的矫正,达到了预期的效果.  相似文献   

16.
针对航摄时拍摄角度倾斜于地面而产生的倾斜影像的几何畸变问题,提出了一种基于空间变换的倾斜影像纠正方法。首先根据坐标转换数学模型和新影像的采样间隔,确定出新影像的大小和原影像在新影像中的坐标域;然后在新影像中判断并统计出在坐标域内的像素点,构成坐标域点集;最后推导了转换模型的反变换,建立了关于原影像图像坐标的线性方程组并进行了改进整理,求解方程组的解并转换成像素坐标后,利用最近邻插值获取到坐标域各点的灰度值,以实现影像的纠正。通过Matlab进行了实验,对倾斜影像纠正效果良好,较一般算法相比耗时更少,该研究提出的算法可用于倾斜影像的配准、拼接和建模等处理。  相似文献   

17.
畸变是鱼眼镜头的最大的问题,针对这一情况,提出一种利用双椭圆模型对鱼眼镜头进行畸变校正的算法,在改善鱼眼畸变的情况下,同时能够保障实时输出;对鱼眼图像进行边缘扫描和检测,采用线性拟合的方法获取鱼眼图像的光心和半径,经过双椭圆模型寻找校正前和校正后图像的映射关系,调用GPU加速处理,达到实时输出的效果,经过实验对比,针对鱼眼镜头引起的畸变问题进行校正并且能够实时输出;  相似文献   

18.
为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。  相似文献   

19.
基于页面前景和最小二乘法的倾斜校正   总被引:4,自引:0,他引:4       下载免费PDF全文
陈波  王加俊  吴陈 《计算机工程》2007,33(15):202-204
鉴于页面版面复杂,提出了一种基于页面前景和最小二乘法的倾斜校正方法。该方法用特定的模式描述页面前景像素,利用模式粗分类分离页面中可能有的图像、图形和表格,通过合并余下的模式得到最大的文字模式结构体,依据该结构体所含基线特征点用最小二乘法拟合出基线方向即页面倾斜方向。实验表明该方法是有效的,速度快,它得到的模式结构体可以继续用来做版面分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号