摘 要: | 目前基于深度学习的表格结构识别有2种主流方法:检测表格框线法和检测表格行与列法。在检测表格框线法中,表格框线所占像素数较少导致了正负样本失衡的问题。虽然检测表格行与列法避免了正负样本失衡的问题,但有的研究将行与列预测分别简化成一列与一行像素的预测,又造成了容错率大的问题。针对该问题,提出了2种信息传输模块:行信息门和列信息门。在模块内,通过特征切片和平铺来对行或列进行软预测,解决了简化行与列预测产生的大容错率问题;通过计算通道注意力进一步提取行或列信息;使用行信息门与列信息门搭建了一个语义分割模型,同时完成表格行分割与列分割。在ICDAR 2013数据集上构建表格的行与列掩模并对模型评估,验证结果表明,与基于检测表格行与列法的分割模型相比,提出的模型有更好的性能,平均查准率、查全率和F1值分别高出0.55%,2.78%和1.48%。
|