首页 | 本学科首页   官方微博 | 高级检索  
     

融合字符结构特征的多任务老挝语文字识别研究
作者姓名:陈琢  周兰江  郝永彬  张建安
作者单位:1. 昆明理工大学信息工程与自动化学院;2. 战略支援部队信息工程大学三院昆明大队
基金项目:国家自然科学基金(61662040);
摘    要:老挝语属于资源稀缺型语言,直接从互联网中获取老挝语文本语料较为困难,老挝语文字识别研究可在有限的图片文本资源中获取更多的老挝语文本语料。在开展老挝文字光学字符识别的研究工作中,针对老挝单字符误切分、上/下位元音以及音调识别位置存在偏差和相似老挝字符的识别问题,该文研究了老挝字符书写等级和下位辅音,提出一种有效融合老挝字符结构特征的多任务字符识别方法。首先,利用深度残差网络提取字符图片中的老挝字符结构特征,通过边框回归矫正单字符包围框;其次,将已矫正切分结果和提取的字符特征作为联合输入,通过双向长短时记忆网络预测老挝字符序列,利用连接主义时间分类对预测结果进行序列对齐;最后,根据老挝字符固定组合优化模型预测结果。实验结果表明:该方法可以精确识别已切分的老挝字符序列,字符错误率指标低至13.06%。

关 键 词:老挝印刷字符识别  老挝字符结构特征  多任务识别  端到端模型
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号