首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
针对表格框线存在倾斜、破裂、断裂及字符与表线粘连等情况,对表格框线的检测方法进行了深入研究。采用了表格框线检测与处理相结合的方法获取表线。在表格框线检测中,提出基于单向准连通的检测方法,有效地克服了框线的倾斜、破裂及粘连等情况;在表格框线的处理中,采用对检测线的连接和筛选的方法,有效解决了表格框线断裂的问题。通过大量的实验,表明该方法能取得较好的检测效果。  相似文献   

2.
表格型票据中框线检测与去除算法   总被引:1,自引:0,他引:1  
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性.  相似文献   

3.
表格分析是对表格的基本结构及形状进行识别的过程,是以后能否从表格单元中正确提取文本信息的关键.在结合表格特点的基础上,采用了表格线检测与处理相结合的方法获取表格框线.检测表格线过程中,通过定义了主表格线长度来加快扫描的速度:在表格线的处理中,针对杂线的剔除、表格线的调整及最终获得表格结构等方面进行了系统的探讨.大量的实验结果表明所提方法是可行的.  相似文献   

4.
基于有向单连通链的表格框线检测算法   总被引:12,自引:0,他引:12  
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息.提出了一种基于所定义的图像结构基元"有向单连通链"的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求.实验证明,该算法具有速度  相似文献   

5.
通过分析表格的框线特征与结构特征,提出一种基于投影特征与结构特征的表格文本图像识别算法。该方法通过投影计算提取表格的框线特征,通过击中或击不中变换提取表格的结构特征,根据所提特征重要性的不同,设定分类判决阈值。实验结果表明,该方法能准确高效地区分表格文本图像与非表格文本图像,具有很强的实用性。  相似文献   

6.
文档处理中消除线噪声的研究   总被引:8,自引:2,他引:8  
文中讨论了在文档处理中对表格当图像处理的一种预处理方法。由于表格型文档的框线会和文档中字符粘连或交叠。这将会降低OCR系统识别模块的性能,从而影响系统整体性能。文中无针对这种情况提出了去除文档图像中线噪声的一个和基本模型,给出了该基本模型消除线噪声的具体算法。  相似文献   

7.
为了提高发票识别的准确率,对票据定位算法进行了研究.现提出一种基于OpenCV形态学的发票定位算法.该算法利用电子发票的表格线规整性,利用形态学操作检测垂直和水平等高线并画出发票表格框架线,再利用右下角基准点及各区域框的长宽定位出发票需要识别的区域.论文算法用Python及OpenCV等库实现,实验结果表明:该算法可以准确定位并裁剪出待识别区域.  相似文献   

8.
基于字线分离的表格识别预处理算法   总被引:1,自引:1,他引:0  
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构.提出了一种基于字线分离的预处理算法.该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离.实验结果表明,该算法能够滤除大部分文字像素,准确有效突出表格文本图像中的框线信息,达到了预处理目的,是后续表格特征提取和识别的有效预备步骤.  相似文献   

9.
在版面分析过程中,有时会将表格误判为图形或将图形误判为表格。为避免对误判的表格或图形进行识别而产生的错误结果,文章提出了一种根据表格框线信息和表格单元信息来区分表格与图形的方法。该方法结合表格的结构特征,提出了作为一个表格的重要组成要素的表格框线和表格单元所必须满足的若干约束条件,通过验证每个条件是否得到满足来区分表格与图形。实验表明,该方法能有效地区分绝大多数表格与图形,极大地降低了对表格与图形的误判率。  相似文献   

10.
现有的表格识别算法速度较慢,且仅能容忍表格线的微小断线,文章给出了基于顶点链编码的表格单元格矩形识别算法,利用边界标定自动机,标定表格单元格内环边界并生成顶点链编码,利用顶点链编码特性,有效地去除表格框线上的锯齿,修复断裂的框线,通过搜索单元格矩形4个角的顶点链编码来获得表格单元格的矩形区域。实验证明本算法具有速度快、鲁棒性高、抗表格框线断裂等优点。  相似文献   

11.
数学形态学是综合了多学科知识的交叉学科,是一种非线性的图像分析理论,己成为图像处理的重要工具之一。文章简单介绍了数学形态学和二值形态学的基本运算—腐蚀和膨胀,并提出了基于数学形态学的乐谱谱线探测算法。实验结果证明,与Hough变换探测直线算法相比,该乐谱谱线探测算法具有运算速度快、效率高、抗噪声能力强等优点。  相似文献   

12.
Two related techniques for the interactive computer aided design of lines and molded surfaces are presented. The first technique is aimed at lines generation from hull form parameters. The second is aimed at fairing a mathematical surface that is based upon the lines. Both schemes employ B-splines to represent waterlines and stations in the lines drawing. The lines of a modern ship which have been generated by the first method are shown. A new indicator of surface fairness called Euler's net is illustrated. Indications are given of the expected future developments in these continuiing efforts.  相似文献   

13.
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途径。算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值,进而沿着角度所指定的方向迅速搜索出边框线。整个检测方法的效率类似于投影法,同时可抗任意角度的旋转。  相似文献   

14.
基于灰度图像的表格框线去除算法   总被引:4,自引:1,他引:4  
笔画与表格框线的交叠的现象在表格型文档中普遍存在,严重影响了文档自动处理系统的性能.现有的去线算法大部分都是基于二值图像的,许多有用的局部信息已经丢失.提出了直接利用图像灰度信息的灰值线检测与去除算法.首先利用图像的边缘特征检测直线以及字线的相交位置;然后通过对直线上相交点对的分析确定字线的交叠方式,并将这些方式归纳为穿透和未穿透两类简单的形式;最后将直线划分为保护区和擦除区两部分,保护区内的像素在去线过程中被保留,而擦除区内的像素则利用灰度形态学算法来擦除.在我国现行支票上的实验表明算法是有效的.  相似文献   

15.
针对日常应用的金融票据,我们使用计算机进行自动处理。在金融票据自动处理系统的多个环节,我们应用了OCR技术。在票据类型识别这一重要环节,我们对印刷体的表头信息进行OCR识别,进一步提高了对票据类型的识别率。我们还对表格中以中文大写数字,手写阿拉伯数字,勾选填写的信息项运用OCR技术进行处理,提高了票据自动处理系统的能力。  相似文献   

16.
一种基于直线提取和补全的通用表格分析方法   总被引:3,自引:0,他引:3  
表格分析是表格自动处理过程中的第一步。本文充分利用表格的特点,给出一个基于直线提取和补全的通用表格分析方法。先使用一种矢量化的直线提取算法在游程连通图的基础上得到表格线,同时对表格进行倾斜校正。然后根据表格特性调整表格线,再从表格线得到表格特征点,最后建立规则通过对表格线的补全来求得表格结构的行单元描述。使用该方法对表格图象进行分析,能处理表格线断裂、文字表格线粘连等常见问题,正确得到表格结构。  相似文献   

17.
票据图像中的格线检测与去除   总被引:1,自引:0,他引:1  
针对票据图像中手写体字符常常与格线交叠的情况,提出了一种直接利用图像灰度信息的格线检测与去除算法。利用字符和格线的边缘信息定位格线并检测字线的交点,然后根据笔画与格线的两种交叠方式(相割与相交)将格线上的像素划分为两个区域:保护区和擦除区,最后动态地选取填充色去除擦除区内的像素。该算法避免了二值化,对806张真实票据中的小写金额域的识别结果比较,显示了该算法的有效性和鲁棒性。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号