期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

倪崇嘉刘文举徐波《中文信息学报》2009,23(1):112

大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。相似文献

2.

维吾尔语语音检索技术研究

张力文努尔麦麦提·尤鲁瓦斯吾守尔·斯拉木《中文信息学报》2014,28(5):182-186

随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建。最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%。相似文献

3.

基于HTK的维吾尔语连续数字语音识别 总被引：2，自引：0，他引：2

蔡琴吾守尔·斯拉木 CAI Qin WUSHOUR·silamu 《现代计算机》2007,(4)

根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别. 相似文献

4.

维吾尔语连续语音识别技术研究 总被引：1，自引：0，他引：1

冯丽娟吾守尔·斯拉木《现代计算机》2010,(1):4-7

维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术．主要包括声学模型和语言模趋。在声学模型中,主要介绍基于隐马尔可夫模型（Hidden Markov Model,HMM）的维吾尔语筵续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。相似文献

5.

敢问语音识别的珠穆朗玛——访IBM公司中国区中文语音事业部总经理邹晔伯博士

张建军《中国计算机用户》1998,(27)

70年代,美国就开始致力于语音识别技术的研究。在20多年的研究过程中,语音识别技术经历了从最初的特定人、小词汇量、非连续语音识别到今天的非特定人、大词汇量、连续语音识别的发展历程,并且识别速度和准确率都有明显提高。IBM坚信:计算机生产及使用的下一次飞跃将由人机界面的革新开始。相似文献

6.

基于HMM的维吾尔语连续语音识别系统

那斯尔江·吐尔逊吾守尔·斯拉《计算机应用》2009,29(7):2009-2011

维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK（HMMToolKit）工具实现了基于隐马尔可夫模型（HMM）的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。相似文献

7.

基于HTK的维吾尔语连续语音声学建模 总被引：2，自引：1，他引：2

陶梅吾守尔·斯拉木那斯尔江·吐尔逊《中文信息学报》2008,22(5):56-59

维吾尔语属于阿勒泰语系突厥语族,是黏着性语言。本文根据维吾尔语的特点,分析设计了维吾尔语语音识别系统的总体结构,讨论了维吾尔语最佳识别基元的选择方法,提出建立基于决策树聚类的上下文相关模型,并采用混合高斯分布(GMD)拟合观测概率分布,优化维吾尔语连续语音中HMM模型系统以提高识别性能。最后给出实验对比,得出结论,为今后维吾尔语连续语音识别研究提供依据。相似文献

8.

基于CDCPM的维吾尔语非特定人语音识别

王昆仑《计算机研究与发展》2001,38(10):1242-1245

现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型（CDCPM）的维吾尔语非特定人语音识别。CDCPM用中心距离正态（CDN）分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明：恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97．90％（集内）和94．76％（集外）,取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。相似文献

9.

大词汇量连续语音识别探讨

阮玲英陈立万《电脑与信息技术》2007,15(4):54-56

文章探讨了中文和英文的大词汇量连续语音识别,讨论了如何设计数据库进行不同识别技术的评测,采用何种评测方法,以及一些代表性的语音识别技术. 相似文献

10.

端到端维吾尔语语音识别研究

丁枫林郭武孙健《小型微型计算机系统》2020,(1):19-23

近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语种上取得了显著的效果.本文将自注意力机制和链接时序分类损失代价函数相结合,将这种端到端模型应用到维吾尔语语音识别上.考虑到维吾尔语属于典型的黏着语,其丰富的构词形式使得维吾尔语的词汇量异常庞大,本文引入字节对编码算法进行建模单元的生成,从而获得合适的端到端建模输出单元.在King-ASR450维吾尔语数据集上,提出的算法明显优于基于隐马尔可夫模型的经典混合系统和基于双向长短时记忆网络的端到端模型,最终识别词准确率为91.35%. 相似文献

11.

基于HTK的维吾尔语连续音素识别技术研究

米日古力·阿布都热素米吉提·阿不力米提艾克白尔·帕塔尔艾斯卡尔·艾木都拉《计算机工程与应用》2013,(22):150-154,172

以建立维吾尔语连续音素识别基础平台为目标,在HTK（基于隐马尔可夫模型的工具箱）的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。相似文献

12.

维吾尔语中清化元音的实验语音学研究 总被引：1，自引：0，他引：1

地里木拉提·吐尔逊艾斯卡尔·艾木都拉《中文信息学报》2010,24(5):117-124

该文根据语音合成与识别等语音应用研究的需求,从文本分析模块入手,利用“维吾尔语语音声学参数库”,选择了带高元音/i/,/u/和/ü/的多音节词(双音节、三音节词),分别对其发生清化和保持原来浊特性时的三种高元音的时长,音高和音强进行了统计分析,归纳了其发生清化时的时长、共振峰和音强在开音节和闭音节中的分布模式,从实验语音学的角度出发,进一步探讨了维吾尔语中三个高元音的清化特性,并验证了语言学者凭听力和生理而总结出来的结论与声学上的结论的一致性。其目的是为了提高语音合成的自然度即更好的为自然语言处理服务。该项研究对维吾尔语语言乃至整个阿尔泰语系语言的韵律研究具有较高的参考价值。相似文献

13.

基于子字单元的维吾尔语语音识别研究

下载免费PDF全文

薛化建董兴华周喜吐尔洪·吾司曼李晓《计算机工程》2011,37(20):208-210

为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。相似文献

14.

基于垃圾模型的维吾尔语关键词识别

丁玉忠吾守尔·斯拉木那斯尔江·吐尔逊《电脑与微电子技术》2011,(12):20-23

关键词识别是语音识别中的一个重要研究方向，而维吾尔语的关键词识别研究刚刚开始．结合维吾尔语音节特点和考虑影响关键词识别因素，提出在HMM模型的基础上对非关键词建立垃圾模型的方法，来提高关键词的识别效率。相似文献

15.

维吾尔语语音识别语料库中的OOV研究

张小燕宿建军薛化建王磊《计算机工程与设计》2012,33(2):772-776

鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现.应用该算法进行电话语音库的文本转写,构建了维吾尔语的电话语音库.实验结果表明,该控制测试集OOV的方法能够有效地提高维吾尔语语音识别率. 相似文献

16.

说话人自适应技术在维吾尔语语音识别中的应用研究

努尔麦麦提·尤鲁瓦斯张力文吾守尔·斯拉木《中文信息学报》2016,30(3):79-84

该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。
相似文献