基于汉字拆分嵌入和二部图的残损碑文识别 |
| |
引用本文: | 蔺广逢,吴娜,贺梦兰,张二虎,孙强.基于汉字拆分嵌入和二部图的残损碑文识别[J].电子与信息学报,2024(2):564-573. |
| |
作者姓名: | 蔺广逢 吴娜 贺梦兰 张二虎 孙强 |
| |
作者单位: | 1. 西安理工大学印刷包装与数字媒体学院;2. 西安理工大学自动化与信息工程学院 |
| |
基金项目: | 国家自然科学基金(61771386);;陕西省重点研发计划(2020SF-359);;陕西省自然科学基础研究计划(2021JM-340)~~; |
| |
摘 要: | 古籍碑刻承载着丰富的历史文化信息,但是由于自然风化浸蚀和人为破坏使得碑石上的文字信息残缺不全。古碑文语义信息多样化且样例不足,使得学习行文语义补全识别残损文字变得十分困难。该文试图从字形空间语义建模解决补全残损汉字进行识别理解这一挑战性任务。该文在层级拆分嵌入(HDE)编码方法的基础上使用动态图修补嵌入(DynamicGrape),对待识别汉字的图像进行特征映射并判别是否残损。如未残损直接转化为层级拆分编码,输入二部图推理字节点到部件节点的边权重,比对字库编码识别理解;如残损需要在字库里检索可能字和部件,对汉字编码的特征维度进行选择,输入二部图推理预测可能的汉字结果。在自建的数据集以及中文自然文本(CTW)数据集中进行验证,结果表明二部图网络可以有效迁移和推理出残损文字字形信息,该文方法可以有效对残损汉字进行识别理解,为残损结构信息处理开拓出了新的思路和途径。
|
关 键 词: | 残损碑文 碑文预测 碑文识别 残损文字识别 二部图神经网络 |
|