首页 | 本学科首页   官方微博 | 高级检索  
     

版面分析中表格与图形的鉴别
引用本文:卜飞宇,刘长松,丁晓青.版面分析中表格与图形的鉴别[J].计算机工程与应用,2004,40(12):83-87.
作者姓名:卜飞宇  刘长松  丁晓青
作者单位:1. 中国科学院软件研究所,北京,100080
2. 清华大学电子工程系智能技术与系统国家重点实验室,北京100084
基金项目:国家自然科学基金资助(编号:60241005),国家863高技术研究发展计划资助(编号:2001AA114081)
摘    要:在版面分析过程中,有时会将表格误判为图形或将图形误判为表格。为避免对误判的表格或图形进行识别而产生的错误结果,文章提出了一种根据表格框线信息和表格单元信息来区分表格与图形的方法。该方法结合表格的结构特征,提出了作为一个表格的重要组成要素的表格框线和表格单元所必须满足的若干约束条件,通过验证每个条件是否得到满足来区分表格与图形。实验表明,该方法能有效地区分绝大多数表格与图形,极大地降低了对表格与图形的误判率。

关 键 词:版面分析  表格  图形  表格框线  表格单元  OCR
文章编号:1002-8331-(2004)12-0083-05

Distinguish Tables from Graphics in Layout Analysis
Bu Feiyu,Liu Changsong,Ding Xiaoqing.Distinguish Tables from Graphics in Layout Analysis[J].Computer Engineering and Applications,2004,40(12):83-87.
Authors:Bu Feiyu  Liu Changsong  Ding Xiaoqing
Affiliation:Bu Feiyu 1 Liu Changsong 2 Ding Xiaoqing 21
Abstract:Tables may be treated as graphics,and graphics may be treated as tables by mistake of layout analysis.In order to avoid this kind of error,this paper presents a method to distinguish tables from graphics based on the struc-tural constrained information of table frame lines and cells.According to the structure of a table,some necessary restric-tions that must be satisfied by all frame lines and cells in a table are presented in this paper.And we verify all these restrictions to distinguish tables from graphics.Experiments show that this method is effective.
Keywords:Layout  analysis  Table  Graphics  Frame  line  Cell  OCR
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号