共查询到18条相似文献,搜索用时 140 毫秒
1.
《计算机应用与软件》2016,(6)
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。 相似文献
2.
对于用图像进行几何检测,由数码相机生成的图像存在一些固有缺点,如存在径向畸变、倾斜几何变形等。为此提出了一种可同时精确校正数码相机图像的径向畸变和倾斜失真的算法。该算法基于标准网格,首先分别建立倾斜变形模型和径向畸变模型,由此建立目标图像的倾斜变形和径向畸变的联合变形模型;然后用最小二乘法和最优化算法求根据联合失真模型求得标准网格的失真参数,利用该参数可校正同等条件下获得的目标图像;最后对实际图像进行了校正实验,获得了满意的校正结果,说明该算法能有效地同时精确校正图像的径向畸变和倾斜失真。 相似文献
3.
4.
5.
在机器视觉检测中大视场短焦距摄像机镜头一般都存在一定程度的光学畸变,在高精度测量中必须对摄像机镜头畸变进行校正。提出利用光学成像规律和镜头畸变校正模型相结合的畸变校正方法求出初始畸变系数,然后通过优化目标函数求出最优畸变系数,最后采用三次B样条插值对畸变图像进行灰度重建。实验结果表明该方法在不依赖摄像机内部参数的前提下,校正后径向均方根误差为0.45个像素,灰度重建后径向均方根误差为0.36个像素。 相似文献
6.
苗立刚 《中国图象图形学报》2009,14(8):1656-1662
为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。 相似文献
7.
8.
9.
10.
针对图像末制导系统中,由弹体姿态变化引起的图像几何失真,提出了一种新的弹载图像几何失真的校正方法,并首先根据仿射投影不改变目标平行结构的特性,提出了以仿射投影图像为目标进行校正的思想;然后根据弹载摄像机成像特点,推导出了目标透视投影和仿射投影与弹体俯仰角之间的函数关系;最后利用该函数关系,通过合理的坐标系设置,结合惯导和图像信息来求得目标的校正图像。仿真实验结果表明,该方法能有效地校正由弹体姿态引起的图像几何失真,不仅有利于目标的精确定位,而且对惯导误差不敏感,计算量也较小。 相似文献
11.
提出一种非量测数码相机标定的直接方法。该方法基于直线约束条件,即在正确进行畸变纠正后,物方空间的三维直线投影到像片平面上也应该是一条直线。为了将畸变直线纠正成理想直线,利用畸变模型对其进行畸变纠正,并采用Levenberg-Marquardt算法对非线性方程组进行求解,解出符合条件的最佳畸变参数。实验结果证明该方法具有较强的鲁棒性与实用性。 相似文献
12.
计算机视觉通常采用针孔摄像机模型,但对于存在较大畸变的鱼眼镜头或广角镜头来说,会造成图像中同时存在透视变形和像差畸变。解决此问题的传统方法一般是采用标准网格板来标定摄像机参数,但需要较多的已知信息。为了进行精确的标定,提出了一种新的标定方法,该新方法不需要任何空间3维信息,即可用单幅普通图像来标定摄像机的像差系数及内参数,并可将畸变图像校正到相似变换。为了纠正像差畸变和计算消影点,该方法采用了直线的射影不变性,即共线点的投影仍然共线,平行直线束的投影相交于一点的性质;为了纠正透视变形,还采用了直线的相似不变性,即正交直线的夹角在相似变换中仍然保持正交的性质。用该方法标定的摄像机的参数包括像差系数、焦距、主点和纵横比,同时将图像纠正到了相似变换。用实验室图像和室外图像进行了仿真实验都得到了精确、可靠的结果。 相似文献
13.
David Fernández-Mota Josep Lladós Alicia Fornés 《International Journal on Document Analysis and Recognition》2014,17(3):293-312
Text line segmentation in handwritten documents is an important task in the recognition of historical documents. Handwritten document images contain text lines with multiple orientations, touching and overlapping characters between consecutive text lines and different document structures, making line segmentation a difficult task. In this paper, we present a new approach for handwritten text line segmentation solving the problems of touching components, curvilinear text lines and horizontally overlapping components. The proposed algorithm formulates line segmentation as finding the central path in the area between two consecutive lines. This is solved as a graph traversal problem. A graph is constructed using the skeleton of the image. Then, a path-finding algorithm is used to find the optimum path between text lines. The proposed algorithm has been evaluated on a comprehensive dataset consisting of five databases: ICDAR2009, ICDAR2013, UMD, the George Washington and the Barcelona Marriages Database. The proposed method outperforms the state-of-the-art considering the different types and difficulties of the benchmarking data. 相似文献
14.
各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础. 相似文献
15.
目的 手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割。针对这些问题提出一种基于文本行回归-聚类联合框架的手写文本行提取方法。方法 首先,采用各向异性高斯滤波器组对图像进行多尺度、多方向分析,利用拖尾效应检测脊形结构提取文本行主体区域,并对其骨架化得到文本行回归模型。然后,以连通域为基本图像单元建立超像素表示,为实现超像素的聚类,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现超像素的聚类与所属文本行标注。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。结果 在HIT-MW脱机手写中文文档数据集上进行文本行提取测试,检测率DR为99.83%,识别准确率RA为99.92%。结论 实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。 相似文献
16.
基于双线性插值的鱼眼图像校正方法 总被引:1,自引:0,他引:1
鱼眼镜头具有大视场、短焦距等优点,近年来被广泛应用到不同的领域。由于鱼眼镜头成像存在较大的畸变,目前主要用来目标监测,在目标物体的识别方面应用得很少。为此,提出一种基于球面透视投影约束的鱼眼图像校正方法,并用双线性插值法对校正后的图像进行填充,为鱼眼镜头在目标物体识别跟踪方面的应用做了准备工作。实验结果表明采用上述方法能够很好地对鱼眼图像畸变进行校正,且校正后的鱼眼图像符合人的直观感觉,真实感较强,图像边缘清晰。 相似文献
17.
Goh Wee Leng
D. P. Mital
Tay Sze Yong
Tan Kok Kang
《Engineering Applications of Artificial Intelligence》1994,7(6):639-651To efficiently store the information found in paper documents, text and non-text regions need to be separated. Non-text regions include half-tone photographs and line diagrams. The text regions can be converted (via an optical character reader) to a computer-searchable form, and the non-text regions can be extracted and preserved in compressed form using image-compression algorithms. In this paper, an effective system for automatically segmenting a document image into regions of text and non-text is proposed. The system first performs an adaptive thresholding to obtain a binarized image. Subsequently the binarized image is smeared using a run-length differential algorithm. The smeared image is then subjected to a text characteristic filter to remove error smearing of non-text regions. Next, baseline cumulative blocking is used to rectangularize the smeared region. Finally, a text block growing algorithm is used to block out a text sentence. The recognition of text is carried out on a text sentence basis. 相似文献
18.
增强现实中的摄像机径向畸变校正 总被引:1,自引:0,他引:1
增强现实系统中,有效地进行摄像机镜头畸变校正对提高虚拟环境的精确性具有重要意义.首先提出一种基于成像几何的畸变校正方法,采用带有一阶径向畸变的摄像机模型,对镜头径向畸变进行校正,再根据校正后的图像计算摄像机投影矩阵.实验表明,基于成像几何的畸变校正算法具有较高的畸变校正精度,640×480的图像中,最大畸变量达90多个像素.与利用理想针孔摄像机模型得到的增强现实环境相比,畸变校正后得到的叠加结果更为精确. 相似文献