首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 140 毫秒
1.
针对表格框线存在倾斜、破裂、断裂及字符与表线粘连等情况,对表格框线的检测方法进行了深入研究。采用了表格框线检测与处理相结合的方法获取表线。在表格框线检测中,提出基于单向准连通的检测方法,有效地克服了框线的倾斜、破裂及粘连等情况;在表格框线的处理中,采用对检测线的连接和筛选的方法,有效解决了表格框线断裂的问题。通过大量的实验,表明该方法能取得较好的检测效果。  相似文献   

2.
一种基于直线提取和补全的通用表格分析方法   总被引:3,自引:0,他引:3  
表格分析是表格自动处理过程中的第一步。本文充分利用表格的特点,给出一个基于直线提取和补全的通用表格分析方法。先使用一种矢量化的直线提取算法在游程连通图的基础上得到表格线,同时对表格进行倾斜校正。然后根据表格特性调整表格线,再从表格线得到表格特征点,最后建立规则通过对表格线的补全来求得表格结构的行单元描述。使用该方法对表格图象进行分析,能处理表格线断裂、文字表格线粘连等常见问题,正确得到表格结构。  相似文献   

3.
表格型票据中框线检测与去除算法   总被引:1,自引:0,他引:1  
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性.  相似文献   

4.
沈军强  肖刚  高飞  陈久军 《计算机工程》2009,35(17):187-189
选票表格几何结构识别是选票图像几何结构识别的关键。提出一种基于表格线游程的表格域提取方法,实现选票表格几何结构识别。该方法以表格线游程作为表格线检测的矢量基元,在一定的约束条件下合并表格线游程实现选票表格中表格线的提取,通过提取得到的表格线实现选票表格中表格域的提取。实验结果表明该方法能够快速有效地实现选票图像的几何结构识别。  相似文献   

5.
基于灰度图像的表格框线去除算法   总被引:4,自引:1,他引:4  
笔画与表格框线的交叠的现象在表格型文档中普遍存在,严重影响了文档自动处理系统的性能.现有的去线算法大部分都是基于二值图像的,许多有用的局部信息已经丢失.提出了直接利用图像灰度信息的灰值线检测与去除算法.首先利用图像的边缘特征检测直线以及字线的相交位置;然后通过对直线上相交点对的分析确定字线的交叠方式,并将这些方式归纳为穿透和未穿透两类简单的形式;最后将直线划分为保护区和擦除区两部分,保护区内的像素在去线过程中被保留,而擦除区内的像素则利用灰度形态学算法来擦除.在我国现行支票上的实验表明算法是有效的.  相似文献   

6.
基于有向单连通链的表格框线检测算法   总被引:12,自引:0,他引:12  
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息.提出了一种基于所定义的图像结构基元"有向单连通链"的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求.实验证明,该算法具有速度  相似文献   

7.
刘云锴  彭程  边赟 《计算机应用》2021,41(z1):250-254
针对传统表格结构识别算法中,前期图像预处理工作量大、复杂表格结构识别率低、高分辨率和高复杂度表格时间开销过于大的问题,提出先对图像表格结构利用直线段检测器进行框线检测,再利用双阈值直线判断规则,对本应属于同一直线的多条线段进行合并细化,最后对横纵线交点处缺失或过长线段,采用表格结构整体框线对齐的快速识别算法.实验结果表明,该算法既可以对图像高分辨率下简单表格和复杂表格准确识别,也可以满足图像低分辨率中简单表格和复杂表格的识别需求,可以容忍一定倾斜角度,因此减少了图像预处理工作,缩短了检测时间,甚至可以对非严格定义表格结构进行精准识别,进一步推动图像表格结构通用识别算法的进程.  相似文献   

8.
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途径。算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值,进而沿着角度所指定的方向迅速搜索出边框线。整个检测方法的效率类似于投影法,同时可抗任意角度的旋转。  相似文献   

9.
提出了一种考虑斜线分隔符的通用表格的分析方法.在表格单元结构确定后,依据表格常识,用局部多角度投影的方法对表格单元进行斜线检测,在内容提交识别核心以前,针对含有斜线分隔符的单元格进行去除斜线操作.实验证明了此方法处理斜线表格的有效性.  相似文献   

10.
在大数据和互联网的历史背景下,信息技术的发展伴随着大量文档的产生。作为数据关系直观体现的表格常见于文档中,表格的归档也是文档处理的重要任务之一。如何在海量的文档中快速地对表格进行自动化识别成为妨碍文档处理迈向智能化的关键因素。作为人工智能研究领域重要分支之一的表格识别,能实现表格对象和结构的自动化检测与识别,被广泛应用在文档智能化处理等场景。因此总结与综述表格识别领域的概念、技术、应用与挑战显得尤为重要。阐述表格识别的概念,指出表格识别任务可被分为表格检测和表格结构识别两大子任务。针对表格检测研究方向主流的anchor-based和anchor-free算法进行介绍和分析,总结不同算法的优缺点。分别阐述基于语义分割、基于双向割并、融合神经网络以及端到端等四大类别的主流的表格结构识别算法的原理和优缺点。同时分析并讨论目前常见的有机融合表格检测和表格结构识别的非端到端与端到端的表格识别算法。最后总结并指出表格识别的应用、挑战与展望。  相似文献   

11.
票据图像中的格线检测与去除   总被引:1,自引:0,他引:1  
针对票据图像中手写体字符常常与格线交叠的情况,提出了一种直接利用图像灰度信息的格线检测与去除算法。利用字符和格线的边缘信息定位格线并检测字线的交点,然后根据笔画与格线的两种交叠方式(相割与相交)将格线上的像素划分为两个区域:保护区和擦除区,最后动态地选取填充色去除擦除区内的像素。该算法避免了二值化,对806张真实票据中的小写金额域的识别结果比较,显示了该算法的有效性和鲁棒性。  相似文献   

12.
在数字影像中,理想的直线段由呈阶梯状排列的游程所构成。论文利用这一特征提出了一种检测直线段的新方法,它以逐行或逐列搜索带有缝隙的游程作为基础,搜索时能根据已取得的部分直线段预测下一段游程的起始像素位置,检测速度较快,获取的直线段较长,所得结果非常适合于用作为基元以合并成完整的直线。该算法的原理还可用来快速确定表格框线的转角。  相似文献   

13.
文档处理中消除线噪声的研究   总被引:8,自引:2,他引:8  
文中讨论了在文档处理中对表格当图像处理的一种预处理方法。由于表格型文档的框线会和文档中字符粘连或交叠。这将会降低OCR系统识别模块的性能,从而影响系统整体性能。文中无针对这种情况提出了去除文档图像中线噪声的一个和基本模型,给出了该基本模型消除线噪声的具体算法。  相似文献   

14.
链码表和线段表用于图像特征提取的研究   总被引:1,自引:0,他引:1  
宋凯  路筠  郁晶源 《控制工程》2006,13(5):488-489,493
针对图像特征提取中轮廓跟踪的问题,介绍了链码表和线段表的数据结构,及其在肺癌细胞特征提取中的应用。在对肺癌细胞图像进行轮廓跟踪过程中,首先用行扫描得到细胞轮廓起点,然后采用链码跟踪技术,跟踪其轮廓,得到一个封闭的轮廓信息即链码表,一直到所有的轮廓跟踪完毕为止。然后通过线性转换得到线段表,再根据链码表和线段表分别求出周长和面积等特征。最后在Visual C++软件平台上对该方法进行了验证。结果证明,该方法可准确求出肺癌细胞图像的几何特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号