首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。  相似文献   

2.
精确校正图像的径向畸变和倾斜失真   总被引:1,自引:0,他引:1       下载免费PDF全文
对于用图像进行几何检测,由数码相机生成的图像存在一些固有缺点,如存在径向畸变、倾斜几何变形等。为此提出了一种可同时精确校正数码相机图像的径向畸变和倾斜失真的算法。该算法基于标准网格,首先分别建立倾斜变形模型和径向畸变模型,由此建立目标图像的倾斜变形和径向畸变的联合变形模型;然后用最小二乘法和最优化算法求根据联合失真模型求得标准网格的失真参数,利用该参数可校正同等条件下获得的目标图像;最后对实际图像进行了校正实验,获得了满意的校正结果,说明该算法能有效地同时精确校正图像的径向畸变和倾斜失真。  相似文献   

3.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

4.
针对机器视觉检测和高精度图像测量中使用的CCD镜头都存在不同程度光学畸变的问题,提出基于混合模型的CCD镜头畸变校正算法。用经典模型对畸变图像进行初次校正,用多面函数拟合法进行二次精校正,用三次B样条函数进行灰度重建。实验结果表明,该方法在不依赖摄像机内部参数条件下,相比单一的镜头畸变校正模型,精度提高,鲁棒性增强,校正后径向均方根误差为0.3个像素。  相似文献   

5.
图像几何畸变校正方法   总被引:6,自引:0,他引:6       下载免费PDF全文
在机器视觉检测中大视场短焦距摄像机镜头一般都存在一定程度的光学畸变,在高精度测量中必须对摄像机镜头畸变进行校正。提出利用光学成像规律和镜头畸变校正模型相结合的畸变校正方法求出初始畸变系数,然后通过优化目标函数求出最优畸变系数,最后采用三次B样条插值对畸变图像进行灰度重建。实验结果表明该方法在不依赖摄像机内部参数的前提下,校正后径向均方根误差为0.45个像素,灰度重建后径向均方根误差为0.36个像素。  相似文献   

6.
为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。  相似文献   

7.
一种基于梯度差的文档图像文本行检测算法   总被引:1,自引:0,他引:1  
王丹  王希常  杨侠 《微型机与应用》2011,30(18):32-34,37
在分析文本行特点的基础上,提出了一种利用水平梯度差进行文档图像的文本行检测算法。该算法首先对输入的文档图像进行水平梯度差计算,然后在局部窗口中求解最大梯度差并进行文本行区域的合并,通过非文本区域过滤来消除字符阶跃的跳变,最后将文档图像以行块的形式进行显示。实验结果表明,与投影算法进行相比,该算法对于行间距较小的文档图像的检测效果较好,时间复杂度较低并且检测的正确率较高,具有一定的鲁棒性和较好的适应性。  相似文献   

8.
基于数学形态学的文档图像倾斜校正算法   总被引:1,自引:0,他引:1  
随着信息采集技术的不断发展,文档图像在信息的数字化管理中越来越重要.对文档图像的倾斜校正进行了研究,给出了基于数学形态学和Hough变换相结合的算法,进行文档图像的倾斜校正,同时将算法应用于印刷体和手写体的文档图像.实验表明该算法可以有效应用于两种文档图像的倾斜校正.  相似文献   

9.
张吉玲  王希常  刘江 《福建电脑》2008,(3):100-100,104
文档图像处理技术已取得很多进展,但是,对于倾斜图像的理解还存在困难。本文对文档图像的倾斜校正进行了研究,根据文档图像的结构特征,给出了基于数学形态学和投影方差相结合的算法,先使用数学形态学进行形态学运算,强化文档图像地结构特征,再使用细化算法,保证投影方差的准确性,最后使用投影方差,进行文档图像的倾斜校正。实验表明,本文提出的算法可以有效的应用于文档图像的倾斜校正。  相似文献   

10.
针对图像末制导系统中,由弹体姿态变化引起的图像几何失真,提出了一种新的弹载图像几何失真的校正方法,并首先根据仿射投影不改变目标平行结构的特性,提出了以仿射投影图像为目标进行校正的思想;然后根据弹载摄像机成像特点,推导出了目标透视投影和仿射投影与弹体俯仰角之间的函数关系;最后利用该函数关系,通过合理的坐标系设置,结合惯导和图像信息来求得目标的校正图像。仿真实验结果表明,该方法能有效地校正由弹体姿态引起的图像几何失真,不仅有利于目标的精确定位,而且对惯导误差不敏感,计算量也较小。  相似文献   

11.
提出一种非量测数码相机标定的直接方法。该方法基于直线约束条件,即在正确进行畸变纠正后,物方空间的三维直线投影到像片平面上也应该是一条直线。为了将畸变直线纠正成理想直线,利用畸变模型对其进行畸变纠正,并采用Levenberg-Marquardt算法对非线性方程组进行求解,解出符合条件的最佳畸变参数。实验结果证明该方法具有较强的鲁棒性与实用性。  相似文献   

12.
基于直线的几何不变性标定摄像机参数   总被引:1,自引:1,他引:0       下载免费PDF全文
计算机视觉通常采用针孔摄像机模型,但对于存在较大畸变的鱼眼镜头或广角镜头来说,会造成图像中同时存在透视变形和像差畸变。解决此问题的传统方法一般是采用标准网格板来标定摄像机参数,但需要较多的已知信息。为了进行精确的标定,提出了一种新的标定方法,该新方法不需要任何空间3维信息,即可用单幅普通图像来标定摄像机的像差系数及内参数,并可将畸变图像校正到相似变换。为了纠正像差畸变和计算消影点,该方法采用了直线的射影不变性,即共线点的投影仍然共线,平行直线束的投影相交于一点的性质;为了纠正透视变形,还采用了直线的相似不变性,即正交直线的夹角在相似变换中仍然保持正交的性质。用该方法标定的摄像机的参数包括像差系数、焦距、主点和纵横比,同时将图像纠正到了相似变换。用实验室图像和室外图像进行了仿真实验都得到了精确、可靠的结果。  相似文献   

13.
Text line segmentation in handwritten documents is an important task in the recognition of historical documents. Handwritten document images contain text lines with multiple orientations, touching and overlapping characters between consecutive text lines and different document structures, making line segmentation a difficult task. In this paper, we present a new approach for handwritten text line segmentation solving the problems of touching components, curvilinear text lines and horizontally overlapping components. The proposed algorithm formulates line segmentation as finding the central path in the area between two consecutive lines. This is solved as a graph traversal problem. A graph is constructed using the skeleton of the image. Then, a path-finding algorithm is used to find the optimum path between text lines. The proposed algorithm has been evaluated on a comprehensive dataset consisting of five databases: ICDAR2009, ICDAR2013, UMD, the George Washington and the Barcelona Marriages Database. The proposed method outperforms the state-of-the-art considering the different types and difficulties of the benchmarking data.  相似文献   

14.
各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础.  相似文献   

15.
目的 手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割。针对这些问题提出一种基于文本行回归-聚类联合框架的手写文本行提取方法。方法 首先,采用各向异性高斯滤波器组对图像进行多尺度、多方向分析,利用拖尾效应检测脊形结构提取文本行主体区域,并对其骨架化得到文本行回归模型。然后,以连通域为基本图像单元建立超像素表示,为实现超像素的聚类,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现超像素的聚类与所属文本行标注。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。结果 在HIT-MW脱机手写中文文档数据集上进行文本行提取测试,检测率DR为99.83%,识别准确率RA为99.92%。结论 实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。  相似文献   

16.
基于双线性插值的鱼眼图像校正方法   总被引:1,自引:0,他引:1  
鱼眼镜头具有大视场、短焦距等优点,近年来被广泛应用到不同的领域。由于鱼眼镜头成像存在较大的畸变,目前主要用来目标监测,在目标物体的识别方面应用得很少。为此,提出一种基于球面透视投影约束的鱼眼图像校正方法,并用双线性插值法对校正后的图像进行填充,为鱼眼镜头在目标物体识别跟踪方面的应用做了准备工作。实验结果表明采用上述方法能够很好地对鱼眼图像畸变进行校正,且校正后的鱼眼图像符合人的直观感觉,真实感较强,图像边缘清晰。  相似文献   

17.
To efficiently store the information found in paper documents, text and non-text regions need to be separated. Non-text regions include half-tone photographs and line diagrams. The text regions can be converted (via an optical character reader) to a computer-searchable form, and the non-text regions can be extracted and preserved in compressed form using image-compression algorithms. In this paper, an effective system for automatically segmenting a document image into regions of text and non-text is proposed. The system first performs an adaptive thresholding to obtain a binarized image. Subsequently the binarized image is smeared using a run-length differential algorithm. The smeared image is then subjected to a text characteristic filter to remove error smearing of non-text regions. Next, baseline cumulative blocking is used to rectangularize the smeared region. Finally, a text block growing algorithm is used to block out a text sentence. The recognition of text is carried out on a text sentence basis.  相似文献   

18.
增强现实中的摄像机径向畸变校正   总被引:1,自引:0,他引:1  
增强现实系统中,有效地进行摄像机镜头畸变校正对提高虚拟环境的精确性具有重要意义.首先提出一种基于成像几何的畸变校正方法,采用带有一阶径向畸变的摄像机模型,对镜头径向畸变进行校正,再根据校正后的图像计算摄像机投影矩阵.实验表明,基于成像几何的畸变校正算法具有较高的畸变校正精度,640×480的图像中,最大畸变量达90多个像素.与利用理想针孔摄像机模型得到的增强现实环境相比,畸变校正后得到的叠加结果更为精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号