基于改进结构与位置对齐网络的表结构识别法 |
| |
引用本文: | 陈雨,蒋三新.基于改进结构与位置对齐网络的表结构识别法[J].国外电子测量技术,2023(12):57-62. |
| |
作者姓名: | 陈雨 蒋三新 |
| |
作者单位: | 上海电力大学电子与信息工程学院 |
| |
摘 要: | 针对现有表格结构检测方法运算量大,表格结构识别准确率低的问题,提出了一种改进的表格结构识别方法。该方法优化了结构与位置对齐网络,提出在一个轻量级的CPU卷积神经网络PPLCNet较深层增加残差连接,加强网络的学习能力;在特征提取和特征融合之间引入卷积块注意力模块(convolutional block attention module, CBAM)机制,同时从通道和空间维度加强模型对目标对象的定位能力;在Head部分采用卷积层替代全连接层,实现权重共享,用来降低模型的计算量;此外,还采用Smooth L1损失函数,通过回归表格四顶点坐标,避免图像畸变对于模型性能的影响;为了验证算法的性能,采用PubTabNet数据集进行测试,结果表明所提方法的准确率(Acc)达到71.58%,基于树编辑距离的相似度(tree-editdistance-based similarity, TEDS)达到94.47%;相比较于改进前模型精度提升了2.76%,TEDS提升了0.79%,模型综合性能更优。
|
关 键 词: | 深度学习 表格结构识别 注意力机制 残差网络 |
|
|