首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 93 毫秒
1.
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。  相似文献   

2.
王行荣  应俊 《计算机科学》2008,35(6):268-271
对手写表格数字识别系统进行研究,提出了输出规则的概念,解决了常用表格数据识别处理的输出描述问题.用此方法已成功地开发出手写数字表格识别处理系统,该系统具有运算量小、抗干扰性强、通用性好、识别率高等特点.  相似文献   

3.
非限定表格信息提取系统的研究   总被引:3,自引:0,他引:3  
刘真  吴泉源 《计算机学报》1995,18(11):808-813
本文概要讨论了非限定一表格信息提取系统的结构和技术难点,提出了一种既有利于表格识别,又能进行表格定位的方法-四角定位点法,介绍了利用四角定位点法实现的非限定表格信息提取系统,实验结果表明,该系统具有通用、快速、准确的特点。  相似文献   

4.
信息时代的高速发展导致数据的大量产生与频繁传输,单单依靠人力很难处理这些数据.依托于人工智能的兴起与发展,数据的利用变得更加高效.表格作为一种特殊的数据形式,逐渐引起了广泛关注.概述了表格识别技术的发展,介绍了传统的表格识别技术及其缺点;介绍了基于深度学习技术的表格检测、表格结构识别、端对端检测与识别以及字符识别,重点阐述了表格检测与结构识别算法;给出表格数据的数据集以及在其上的最新指标,展望了表格检测识别技术的发展前景.  相似文献   

5.
表格分析是对表格的基本结构及形状进行识别的过程,是以后能否从表格单元中正确提取文本信息的关键.在结合表格特点的基础上,采用了表格线检测与处理相结合的方法获取表格框线.检测表格线过程中,通过定义了主表格线长度来加快扫描的速度:在表格线的处理中,针对杂线的剔除、表格线的调整及最终获得表格结构等方面进行了系统的探讨.大量的实验结果表明所提方法是可行的.  相似文献   

6.
采用一种表格识别方法实现对多种类型表格的识别,系统利用表格投影轮廓的功率谱密度作为表格的不变性特征向量。为了解决具有相互对称结构表格的识别问题,提出一种新的特征提取方法:采用区域划分的策略,综合考虑表格图像在水平方向及垂直方向上的特征,以分区投影轮廓的功率谱密度作为表格图像的特征向量。实验表明,这种方法能够有效解决具有对称结构表格的识别问题。  相似文献   

7.
在大数据和互联网的历史背景下,信息技术的发展伴随着大量文档的产生。作为数据关系直观体现的表格常见于文档中,表格的归档也是文档处理的重要任务之一。如何在海量的文档中快速地对表格进行自动化识别成为妨碍文档处理迈向智能化的关键因素。作为人工智能研究领域重要分支之一的表格识别,能实现表格对象和结构的自动化检测与识别,被广泛应用在文档智能化处理等场景。因此总结与综述表格识别领域的概念、技术、应用与挑战显得尤为重要。阐述表格识别的概念,指出表格识别任务可被分为表格检测和表格结构识别两大子任务。针对表格检测研究方向主流的anchor-based和anchor-free算法进行介绍和分析,总结不同算法的优缺点。分别阐述基于语义分割、基于双向割并、融合神经网络以及端到端等四大类别的主流的表格结构识别算法的原理和优缺点。同时分析并讨论目前常见的有机融合表格检测和表格结构识别的非端到端与端到端的表格识别算法。最后总结并指出表格识别的应用、挑战与展望。  相似文献   

8.
受限表格识别系统的研究   总被引:1,自引:0,他引:1  
表格的自动输入、存储、管理已经成为文档智能处理领域的一个重要组成部分。一方面,表格结构复杂多样,使得很难找到一种能良好识别任何表格的通用方法;另一方面,很多领域里使用的表格,需要识别的通常是固定的某些表格单元。因此,设计并实现了一个受限表格识别系统,实验结果表明,该系统提高了表格识别的适应性和正确率。  相似文献   

9.
本文介绍了一个面向具体应用领域的集数据表格的扫描,识别,数据自动入库为一体的软件系统,研究了表格自动定位,汉字,数字的切分,快速识别等关键技术,提出了一种基于笔道方向的手写体数字识别方法。  相似文献   

10.
如今重要的数据大都通过表格直接展示,在分析数据时,除数据和文字信息外,表格结构信息也很重要,要想更加准确、便捷地分析表格数据,能否自动准确地识别表格结构至关重要。现在有很多识别表格结构的方法,对表格单元格检测的准确率也都比较理想,但是很少有方法在特征提取方面做出改进。为了证明图像特征提取在表格结构识别过程中的重要性,针对这一问题在TGRNet的基础上引入了多频谱注意力机制,以便更好地提取图像多个频谱上的特征,使得到的特征更加全面。在公开数据集上的实验结果显示,所做改进较原方法在表格结构识别的单元格空间位置和逻辑位置检测的准确率有所提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号