首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 76 毫秒
1.
讨论由说话人引起的声学差异基础上,研究两种基于模型的自适应算法最大似然线性回归(MLLR)和最大后验概率(MAP)。实验结果表明,不论采用哪种自适应都能使识别率有一定的提升。两种算法之间的差异性在于MAP具有良好的渐进性,但收敛性较差,而MLLR在很大程度上改善了收敛特性,但其渐进特性却不如MAP。  相似文献   

2.
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术用在远场噪声混响环境下来分析其在此环境下的识别性能。实验结果表明,仿真条件下,在墙壁反射系数为0.6,各种噪声环境下MAP有最好的自适应性能,在信噪比(Signal-to-Noise Ratio,SNR)分别为5 dB、10 dB、15 dB时,MAP使远场连续语音词错率(Word Error Rate,WER)平均降低了1.51%、12.82%、2.95%。真实条件下,MAP使WER下降幅度最大达到了37.13%。进一步验证了MAP良好的渐进性,且当自适应句数为1 000时,用MAP声学模型自适应方法得到的远场噪声混响连续语音的识别词错率比自适应前平均降低了12.5%。  相似文献   

3.
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。
  相似文献   

4.
变异情况对语音的影响是导致语音识别系统性能下降的原因之一。一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想。利用自适应算法可以解决这类问题,它采用少量的测试环境数据进行训练,以达到训练模型和测试数据匹配的目的,保证系统良好的识别性能。MAP算法是常用的自适应算法,大多应用于话者自适应环境,该文尝试将其应用于变异语音识别系统中,并通过对该模型做相应改进获得了较好的识别结果。在小词表特定人应力变异的识别实验中,分别用非特定人模型和改进的特定人模型作为初始模型,应用MAP算法,系统识别率均有明显提高,与基本识别系统相比,在10遍自适应数据前提下,识别率分别提高了15.84%和15.97%,最好的识别率达到85.56%和90.42%。  相似文献   

5.
在基于语音识别的智能家居中,用于训练的语料库不完备且应用场景复杂,自然语言语音识别错误接受率远远高于小词汇的语音识别的错误接受率.作者在设计与实现基于自然语言的语音识别智能家居系统的过程中,深入研究了MAP、MLLR算法在基于HMM声学模型参数中的作用,提出了一种综合的自适应方法,并基于开源的语音识别工具CMU SPHIN最终完整的实现了该系统,结果表明所提出的自适应新算法可行有效,较好改善了系统在不同场景中的性能.  相似文献   

6.
黄盈椿  王欢良  冯涛 《计算机工程》2006,32(20):203-204
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。  相似文献   

7.
蒙古语语言中非词首音节短元音位置不确定产生了一词多音、构词音变、协同发音以及口语语流等现象,导致声学模型自适应性差。通过使用小规模的自适应数据集,结合MLLR和MAP建模方法,从τ值的选取和自适应声学模型建模的训练过程两方面对基本蒙古语声学模型的自适应性开展研究,给出了一种适合构建自适应蒙古语语音识别声学模型的MLLR-MAP方法。在Sphinx语音识别实验平台上进行建模实验,使用声学模型识别率与系统识别率评价指标对MAP、MLLR、MAP-MLLR和MLLR-MAP等建模方法进行评价。实验结果表明,在声学模型的总正确率、错误率和准确率三个评价指标上都得到了提升,明显优于基线模型。  相似文献   

8.
本文在对语音识别中基于自适应回归树的极大似然线性变换(MLLR)模型自适应算法深刻分析的基础上,提出了一种基于目标驱动的多层MLLR自适应(TMLLR)算法。这种算法基于目标驱动的原则,引入反馈机制,根据目标函数似然概率的增加来动态决定MLLR变换的变换类,大大提高了系统的识别率。并且由于这种算法的特殊多层结构,减少了许多中间的冗余计算,算法在具有较高的自适应精度的同时还具有较快的自适应速度。在有监督自适应实验中,经过此算法自适应后的系统识别率比基于自适应回归树的MLLR算法自适应后系统的误识率降低了10% ,自适应速度也比基于自适应回归树的MLLR算法快近一倍。  相似文献   

9.
该文研究了基于数据模拟方法和HMM(隐马尔科夫模型)自适应的电话信道条件下语音识别问题。模拟数据模仿了纯净语音在不同电话信道条件下的语音行为。各基线系统的HMM模型分别由纯净语音和模拟语音训练而成。语音识别实验评估了各基线系统HMM模型在采用MLLR算法(最大似然线性回归)做无监督式自适应前后的识别性能。实验证明,由纯净语音转换生成的模拟语音有效地减小了训练语音和测试语音声学性质的不匹配,很大程度上提高了电话语音识别率。基线模型的自适应结果显示模拟数据的自适应性能比纯净语音自适应的性能最大提高达到9.8%,表明了电话语音识别性能的进一步改善和系统稳健性的提高。  相似文献   

10.
提出了一种基于数学统计模型化的说话人归一化训练方法,它将与状态相关的直接均值移动归一化训练方法和MAP/WNR模型自适应方法结合到统一的鲁棒性框架中,为模型自适应方法提供了更加合适的初始模型,在提高自适应速度和保持足够的模型平滑度之间得到了较好的平衡,实验表明,该方法可有效的提高有监督模式下语音识别的鲁棒性。  相似文献   

11.
钟山  何亮  邓妍  刘加 《自动化学报》2009,35(5):546-550
研究了将自适应领域的最大似然线性回归(Maximum likelihood linear regression, MLLR)变换矩阵作为特征进行文本无关的说话人识别算法. 本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法, 并在此基础上进行高层音素聚类以进一步提高识别性能. 在采用多种信道补偿技术后, 在NIST SRE 2006年1训练语段-1测试语段同信道和跨信道数据库上, 基于MLLR特征的系统与其他最好的系统性能接近并有很强的互补性, 经过简单线性融合可以极大提高识别性能.  相似文献   

12.
This paper presents a fuzzy control mechanism for conventional maximum likelihood linear regression (MLLR) speaker adaptation, called FLC-MLLR, by which the effect of MLLR adaptation is regulated according to the availability of adaptation data in such a way that the advantage of MLLR adaptation could be fully exploited when the training data are sufficient, or the consequence of poor MLLR adaptation would be restrained otherwise. The robustness of MLLR adaptation against data scarcity is thus ensured. The proposed mechanism is conceptually simple and computationally inexpensive and effective; the experiments in recognition rate show that FLC-MLLR outperforms standard MLLR especially when encountering data insufficiency and performs better than MAPLR at much less computing cost.  相似文献   

13.
情感是语音识别研究中一个不可避免的问题,不同的情感对于语音有着不同的影响,这种影响使得中性语音识别系统在实际应用中的识别效果大打折扣。对于类似的影响通常的解决方法有寻找鲁棒特征,特征归一化以度模型调整训练等。本文通过自适应方法,使用少量情感数据,在中性语音模型的基础上自适应得到新的情感语音模型。实验证明,新模型对于情感语音有着更好的整体识别率。  相似文献   

14.
15.
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。  相似文献   

16.
王忠培  周健 《计算机工程》2008,34(17):99-101
在分析原有HMIPv6网络架构的基础上提出一种基于树状和分布式架构相结合的网络架构。该架构可解决在HMIPv6中的MAP发现协议的不足,解决较高层次MAP的瓶颈问题和提高原有网络的鲁棒性。针对2种架构给出了各自的选择算法,论证该架构可适用于多种网络,有广泛的应用范围。  相似文献   

17.
我国枢纽机场长期处于繁忙状态,高负荷带来信息交互失真的风险,语音识别技术可用于辅助决策,然而管制语音特殊性及样本量局限性使传统深度学习技术难以直接应用于机坪管制领域。针对这一问题,提出了一种基于小样本学习的语音识别方法。首先提出数据增强方法,通过结合先验领域知识,构建基于数据生成策略组的生成对抗网络来增强声学模型识别能力来进一步提升模型效果;然后通过重构声学模型部分结构和参数;最后通过迁移学习方法将通用语音库中的声学建模特征应用到机坪管制语音指令的识别中。实验结果表明,该方法将字错率减少至6.14%。该研究可应用于机场高级地面活动引导及控制系统中机坪管制语音指令的检测和识别,助力现代机场高质量运行。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号