首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法
引用本文:努尔艾力·喀迪尔,彭良瑞,哈力木拉提.一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法[J].计算机应用与软件,2015,32(1).
作者姓名:努尔艾力·喀迪尔  彭良瑞  哈力木拉提
作者单位:1. 清华大学电子工程系,清华信息科学与技术国家实验室 北京,100084
2. 新疆大学信息科学与工程学院 新疆乌鲁木齐830046
摘    要:维吾尔文和阿拉伯文是采用阿拉伯文字母的从右向左书写的连写文字。它们识别方法的研究对于多文种文本图像内容的利用具有重要意义。利用HTK工具包,分别建立基于隐马尔科夫模型HMM(Hidden Markov Model)的印刷体维吾尔文和阿拉伯文识别系统,其中特征提取部分采用分布密度特征和局部方向特征。研究利用HTK工具建立维吾尔文和阿拉伯文统计语言模型,并将语言模型用于改进识别系统性能。实验结果表明采用统计语言模型可有效提高文字识别系统性能。其中,在包含24 000个单词的印刷体维吾尔文测试集上,通过利用语言模型识别率从78.28%提高到97.45%;在包含759个单词的印刷体阿拉伯文测试集上,通过利用语言模型识别率从79.07%提高到85.80%。

关 键 词:隐马尔科夫模型  统计语言模型  维吾尔文  阿拉伯文  识别

UYGHUR AND ARABIC RECOGNITION METHODS BASED ON HMM AND STATISTICAL LANGUAGE MODEL
Nueraili Kadier,Peng Liangrui,Halimulati.UYGHUR AND ARABIC RECOGNITION METHODS BASED ON HMM AND STATISTICAL LANGUAGE MODEL[J].Computer Applications and Software,2015,32(1).
Authors:Nueraili Kadier  Peng Liangrui  Halimulati
Abstract:
Keywords:Hidden Markov model  Statistical language model  Uyghur  Arabic  Recognition
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号