首页 | 本学科首页   官方微博 | 高级检索  
     

基于行列信息门的表格结构识别网络
作者姓名:包云超  周全  孔令军  王茜雯
作者单位:1. 南京邮电大学通信与信息工程学院;2. 金陵科技学院网络与通信工程学院
基金项目:中国博士后科学基金(2020M671595);;江苏省博士后科研资助计划项目(2020Z198)~~;
摘    要:目前基于深度学习的表格结构识别有2种主流方法:检测表格框线法和检测表格行与列法。在检测表格框线法中,表格框线所占像素数较少导致了正负样本失衡的问题。虽然检测表格行与列法避免了正负样本失衡的问题,但有的研究将行与列预测分别简化成一列与一行像素的预测,又造成了容错率大的问题。针对该问题,提出了2种信息传输模块:行信息门和列信息门。在模块内,通过特征切片和平铺来对行或列进行软预测,解决了简化行与列预测产生的大容错率问题;通过计算通道注意力进一步提取行或列信息;使用行信息门与列信息门搭建了一个语义分割模型,同时完成表格行分割与列分割。在ICDAR 2013数据集上构建表格的行与列掩模并对模型评估,验证结果表明,与基于检测表格行与列法的分割模型相比,提出的模型有更好的性能,平均查准率、查全率和F1值分别高出0.55%,2.78%和1.48%。

关 键 词:深度学习  表格结构识别  行信息门  列信息门
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号