一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法 UYGHUR AND ARABIC RECOGNITION METHODS BASED ON HMM AND STATISTICAL LANGUAGE MODEL期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法

引用本文：	努尔艾力·喀迪尔,彭良瑞,哈力木拉提.一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法[J].计算机应用与软件,2015,32(1).

作者姓名：	努尔艾力·喀迪尔彭良瑞哈力木拉提

作者单位：	1. 清华大学电子工程系,清华信息科学与技术国家实验室北京,100084 2. 新疆大学信息科学与工程学院新疆乌鲁木齐830046

摘要：	维吾尔文和阿拉伯文是采用阿拉伯文字母的从右向左书写的连写文字。它们识别方法的研究对于多文种文本图像内容的利用具有重要意义。利用HTK工具包,分别建立基于隐马尔科夫模型HMM(Hidden Markov Model)的印刷体维吾尔文和阿拉伯文识别系统,其中特征提取部分采用分布密度特征和局部方向特征。研究利用HTK工具建立维吾尔文和阿拉伯文统计语言模型,并将语言模型用于改进识别系统性能。实验结果表明采用统计语言模型可有效提高文字识别系统性能。其中,在包含24 000个单词的印刷体维吾尔文测试集上,通过利用语言模型识别率从78.28%提高到97.45%;在包含759个单词的印刷体阿拉伯文测试集上,通过利用语言模型识别率从79.07%提高到85.80%。
关键词：	隐马尔科夫模型统计语言模型维吾尔文阿拉伯文识别
UYGHUR AND ARABIC RECOGNITION METHODS BASED ON HMM AND STATISTICAL LANGUAGE MODEL

Nueraili Kadier,Peng Liangrui,Halimulati.UYGHUR AND ARABIC RECOGNITION METHODS BASED ON HMM AND STATISTICAL LANGUAGE MODEL[J].Computer Applications and Software,2015,32(1).

Authors:	Nueraili Kadier Peng Liangrui Halimulati

Abstract:

Keywords:	Hidden Markov model Statistical language model Uyghur Arabic Recognition
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏