乌金印刷多字体藏文的文本检测与识别 |
| |
引用本文: | 侯闫,高定国,高红梅.乌金印刷多字体藏文的文本检测与识别[J].计算机工程与设计,2023(4):1058-1065. |
| |
作者姓名: | 侯闫 高定国 高红梅 |
| |
作者单位: | 西藏大学信息科学技术学院 |
| |
基金项目: | 国家自然科学基金项目(62166038); |
| |
摘 要: | 为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。
|
关 键 词: | 藏文 乌金字体 多种字体 深度学习 文本检测 文本识别 端到端 |
|
|