首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 62 毫秒
1.
该文讨论了不同非母语条件下的语音识别说话人自适应问题,提出了说话人分类和声学模型合并两种不同的自适应方法,并用实验说明了所提方法的有效性和实用性。  相似文献   

2.
该文根据云南境内少数民族同胞说普通话时明显带有民族口音的语言使用现状,介绍了一个以研究非母语说话人汉语连续语音识别为目的的云南少数民族口音汉语普通话语音数据库,并在其基础上开展了发音变异规律、说话人自适应和非母语说话人口音识别研究,是汉语语音识别中用户多样性研究的重要补充。  相似文献   

3.
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。
  相似文献   

4.
小词汇量非特定人语音识别在嵌入式系统中的应用   总被引:5,自引:0,他引:5  
刘振安  孙捷  王晋军 《计算机工程》2006,32(11):213-215
给出了一个嵌入式小词汇量非特定人语音识别系统的方案,它基于单片微控制器加数字信号处理器(MCU+DSP)架构,用离散隐马尔可大模型方法实现语音识别系统。该系统适应性强,可扩展性好,具有一定的实时性和语言无关性。当在算法上针对汉语普通话进行优化后,则能进一步提高识别汉语的准确性和实时性。  相似文献   

5.
基于语音识别的汉语发音自动评分系统的设计与实现   总被引:6,自引:0,他引:6  
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程.介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准.通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值.  相似文献   

6.
赵博  檀晓红 《计算机应用》2009,29(3):761-763
许多许多计算机辅助英语学习的应用,都忽略了口语的教学,或者缺乏对口语学习结果良好的评估和反馈。对于这一问题,语音识别技术可以从待评价语音与参考模型以及参考语音的相似程度给以评价,作为矫正的依据。该文描述了一个采用语音识别技术的英语口语学习系统。除了通常的发音评分外,提供的矫正还包括基于音素关联和音素识别的错误检测及韵律修正。依据错误类型查询纠正知识库的改进建议,可以及时的给学习者以帮助。实验结果表明,能够纠正有一定基础学习者非故意的多数错误。  相似文献   

7.
Dysarthria is a motor speech disorder caused by neurological injury of the motor component of the motor-speech system. Because it affects respiration, phonation, and articulation, it leads to different types of impairments in intelligibility, audibility, and efficiency of vocal communication. Speech Assistive Technology (SAT) has been developed with different approaches for dysarthric speech and in this paper we focus on the approach that is based on modeling of pronunciation patterns. We present an approach that integrates multiple pronunciation patterns for enhancement of dysarthric speech recognition. This integration is performed by weighting the responses of an Automatic Speech Recognition (ASR) system when different language model restrictions are set. The weight for each response is estimated by a Genetic Algorithm (GA) that also optimizes the structure of the implementation technique (Metamodels) which is based on discrete Hidden Markov Models (HMMs). The GA makes use of dynamic uniform mutation/crossover to further diversify the candidate sets of weights and structures to improve the performance of the Metamodels. To test the approach with a larger vocabulary than in previous works, we orthographically and phonetically labeled extended acoustic resources from the Nemours database of dysarthric speech. ASR tests on these resources with the proposed approach showed recognition accuracies over those obtained with standard Metamodels and a well used speaker adaptation technique. These results were statistically significant.  相似文献   

8.
汉语语音识别中基频特征的直接声学建模方法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出了隐条件随机场对断续基音频率序列进行直接声学建模的方法,该方法针对汉语语音中基频值在清音段连续,浊音段断续的特点,根据隐条件随机场区别于隐马尔可夫模型的重要特性——无需对观察值采用统一的建模方式,直接对不连续基频值与连续谱特征观察值一起进行声学建模。大词汇语音库上的汉语带调音节分类实验表明,隐条件随机场下对断续基音频率序列的直接建模较使用清音段人工平滑基频特征的识别率有明显的提高,还给出了与不同区分性准则训练的隐马尔可夫声学模型的实验性能的比较。  相似文献   

9.
机载连接词语音识别系统与传统语音识别系统相比,具有背景噪声大,系统识别率要求高等特点。依据这些特点,提出了一种基于经验模态分解增强和位移差分倒谱特征的EMD-SDC连接词语音识别方法。经验模态分解的调频调幅特性,可以有效提高机载复杂噪声背景下的端点检测准确度,位移差分倒谱特征由语音帧的一阶差分谱连接扩展而成,能够更好地提取依赖于语言结构的时序信息。该方法对机载交通预警避撞系统提示语音库进行测试,实验结果表明,采用EMD-SDC方法的机载连接词语音识别系统,能够很好地克服机舱背景噪声干扰,在低信噪比条件下实现较高的识别率。  相似文献   

10.
研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建LSA模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度函数初始化质心的k-means聚类算法对LSA模型的向量空间进行聚类。WSJ0语料库上的连续语音识别实验结果表明:LSA+3-gram混合模型能够使识别的词错误率相比较于标准的3-gram下降13.3%。  相似文献   

11.
Laguerre滤波器在抗噪语音识别特征提取中的应用   总被引:1,自引:0,他引:1  
为克服FIR滤波器存在的通阻带特性差、滤波器阶次高等缺点给语音识别系统带来的不利影响,采用Laguerre滤波器组代替过零峰值幅度特征提取中使用的FIR滤波器组进行前端处理。在仔细研究FIR滤波器参数确定方法的基础上,叙述了Laguerre滤波器原理及参数计算方法,并给出了计算结果。孤立词、非特定人语音识别实验结果表明,使用Laguerre滤波器不仅使识别系统抗噪性能优于使用FIR滤波器,而且滤波器阶数也大为下降。  相似文献   

12.
目前卖场中电子货架标签的管理系统主要部署在计算机上,计算机位置相对固定,使用键盘、鼠标交互灵活性不高、操作效率有限,针对以上管理局限,提出了一个基于Android平台和语音识别技术的管理系统设计方案,以提高操作的便携性和工作效率。实验结果表明,该语音管理系统能够以较高的识别性能和操作效率实现对ESL的可移动声控管理,有利于电子货架标签的推广和应用,同时也为基于Android平台的语音识别系统在其他控制领域的应用提供了可供参考的案例和思路。  相似文献   

13.
严格按照语法规则模型指导声学层识别的特定领域语音识别系统,难以处理未经规则描述的插入语或语气词等语言现象。针对这一问题,将在线废料建模方法应用于该系统,详细讨论了此方法中模型参数N的选择策略,分析验证了语料的信噪比SNR值与参数N之间的相关性,提出了基于此相关性的模型参数优化方法,使得系统的句子识别率和槽识别率相对基线系统分别提高了1834%和1147%。  相似文献   

14.
语音在日常生活中承载着信息传递的重要功能,随着深度学习技术的发展,语音识别的准确率得到极大的提高,推动了语音识别技术走向实际应用。介绍语音识别技术的发展情况和基本原理,分析北京市河长制管理信息系统中巡查人员记录问题和社会公众投诉举报过程中的不便之处,提出利用语音识别技术构建北京市河长制智能语音交互系统。介绍该系统的总体架构,阐述智能语音交互技术在移动App和微信公众号中的应用设计,针对河长制具体应用场景提出相应的语音识别准确率提升方案。通过将智能语音识别技术应用到北京市河长制管理工作,提高各级河长和巡查人员工作效率,促进社会公众参与河湖治理,不断提升河长制工作精细化和科学化水平。  相似文献   

15.
针对F-score特征选择算法不能揭示特征间互信息而不能有效降维这一问题,应用去相关的方法对F-score进行改进,利用德语情感语音库EMO-DB,在提取语音情感特征的基础上,根据支持向量机(SVM)的分类精度选择出分类效果最佳的特征子集。与F-score特征选择算法对比,改进后的算法实现了候选特征集较大幅度的降维,选择出了有效的特征子集,同时得到了较理想的语音情感识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号