首页 | 本学科首页   官方微博 | 高级检索  
     

基于HMM的维吾尔语连续语音识别系统
引用本文:那斯尔江·吐尔逊,吾守尔·斯拉.基于HMM的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011.
作者姓名:那斯尔江·吐尔逊  吾守尔·斯拉
作者单位:1. 新疆大学数学与系统科学学院,乌鲁木齐830046;西安交通大学电子与信息工程学院,西安710049
2. 新疆大学信息科学与工程学院,乌鲁木齐,830046
基金项目:国家自然科学基金资助项目,国家语委重点项目 
摘    要:维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。

关 键 词:维吾尔语  连续语音  语音识别  HTK
收稿时间:2008-11-20
修稿时间:2009-04-14

Uyghur continuous speech recognition system based on HMM
NASIRJAN Tursun,WUSHOUR Silamu.Uyghur continuous speech recognition system based on HMM[J].journal of Computer Applications,2009,29(7):2009-2011.
Authors:NASIRJAN Tursun  WUSHOUR Silamu
Affiliation:1.College of Mathematics and System Sciences;Xinjiang University;Urumqi Xinjiang 830046;China;2.School of Electronic and Information Engineering;Xi'an Jiaotong University;Xi'an Shaanxi 710049;3.College of Information Science and Engineering;China
Abstract:Uyghur language is an agglutinative language.It is possible to produce a very large number of words from the same root with suffixes,so that the speech recognition of Uyghur language is very difficult.Combined with the characteristics of Uyghur language,this paper built a Uyghur continuous speech database,and designed the Hidden Markov Model(HMM) based Uyghur continuous speech recognition system by using the HTK(HMMToolKit).On the acoustic level,this paper selected triphone as the basic recognition unit,and...
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号