共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
根据不同尺度子带特征反映语音的不同细节特性,提出一种噪声下的多层子带(MLS)语音识别方法。将语音频谱分成多层多个子带,首先各子带分另单独进行识别,然后将各层各子带识别概率综合起来得到最终识别结果。将新方法应用于TIMIT数据饣E-Set在NoiseX92白噪声和F16噪声下识别实验。实验结果表明,多层子带方法在噪声环境和无噪情况下识别性能都有很大提高。 相似文献
3.
刘晶 《计算机测量与控制》2018,26(12):140-144
为了更准确地在噪声环境中对不同语音信号进行识别,提出了一种用于普适语音环境下的自优化语音活动检测(VAD)算法,该算法运用个性化语音命令自动识别系统的语音信号,并能够有效地从多个发声者的混合语音中分离出个体发声者的声音,通过跟踪语音功率谱的较高幅度部分和自适应地抑制噪声来检测发声者的语音信号;设计并实现了一种处理多个发声者任务的自动语音识别(ASR),免去了对干净的语音变化进行先验估计,直接利用噪声本身产生语音/非语音判决的阈值以完成自优化过程;使用语音数据库NOIZEUS进行了评价测试,实验结果表明,所提出的盲源分离和噪声抑制方法不需要任何额外的计算过程,有效地减少了计算负担。 相似文献
4.
传统的语音活动检测的方法,在噪声比较恶劣(一般指信噪比在5db以下)的环境下,效果很差,而本文提出的语音活动检测的方法在低信噪比的情况下仍然能够达到很好的效果.该方法主要包含两部分:第一部分是噪声抑制,第二部分是基于状态机的语音活动检测.通过实验结果可以证明,本文提出的方法在白噪声,嘈杂人声和汽车噪声的环境下比G.729采用的语音活动检测的方法提高很多. 相似文献
5.
在噪声环境下的语音识别率将会受到严重的影响.语音增强是解决噪声污染的有效方法.在语音增强技术中,语音识别和说话人识别是很重要的.因此.识别装置通常工作在环境噪声下.语音增强不仅与信号处理技术相关,并涉及到人的听觉感知和语音认知.由于噪声的来源有很多,在不同的应用场合,其特点也各不相同.因此很难确定一个通用的适用于各种环境噪声的语音增强算法.根据不同的噪声,采用不同的语音增强策略. 相似文献
6.
7.
针对强噪声环境下语音增强中噪声估计和先验信噪比估计算法导致的语音失真和音乐噪声的问题,利用语音和噪声的统计模型的对称性得到一种噪声幅度的估计值为参考,提出了一种噪声估计算法,改进了先验信噪比估计算法,形成了一种新的增强算法,适用于强噪声环境下的语音增强。由仿真实验给出的客观评分看出,在0 dB乃至-5 dB条件下,给出信噪比估计算法能够有效减小信号失真,基本上没有残留音乐噪声。 相似文献
8.
针对非平稳噪声环境和低信噪比的情况,提出了一种基于低频区语音特性的非平稳噪声估计方法,通过构造一个时变的权值,实现对噪声的实时估计,同时结合人耳听觉掩蔽效应,利用估计出的噪声自适应设定增强系数。仿真实验表明,该方法能够较好地抑制背景噪声,提高信噪比,减少语音失真。 相似文献
9.
抗噪声语音识别及语音增强算法的应用 总被引:1,自引:0,他引:1
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。 相似文献
10.
11.
12.
13.
14.
章讨论了高噪声背景下的汉语语音识别技术,从语音识别的一般方法出发,研究了基于半音节的半连续型隐马尔可夫模型(SCHMM)原理和算法,介绍了用DSP构建实现的方法,采用喉头送话器抑制了背景噪声,获得了较高的识别准确率。 相似文献
15.
16.
17.
提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。 相似文献
18.
针对多噪声环境下的语音识别问题,提出了将环境噪声作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪声环境下的声学模型两层组成,通过含噪语音分类模型降低训练数据与测试数据的差异,消除了特征空间研究对噪声稳定性的限制,并且克服了传统多类型训练在某些噪声环境下识别准确率低的弊端,又通过深度神经网络(DNN)进行声学模型建模,进一步增强声学模型分辨噪声的能力,从而提高模型空间语音识别的噪声鲁棒性。实验中将所提模型与多类型训练得到的基准模型进行对比,结果显示所提层级语音识别模型较该基准模型的词错率(WER)相对降低了20.3%,表明该层级语音识别模型有利于增强语音识别的噪声鲁棒性。 相似文献
19.
提出了一种将人耳听觉响度特性应用于噪声下语音识别的前端特征提取方法.本文使用分层遗传算法设计响度加权滤波器,对频谱进行听觉特性加权.将本方法应用于TIMIT数据包的E-SET在Noise X92的各种噪声条件下的识别实验.实验结果表明,在各种噪声的不同信噪比下,对LPCC和MFCC特征,采用响度加权平均识别率分别有7%和¨%的提高,证明本方法是有效的. 相似文献
20.
提出一种噪声下的多数据流子带语音识别方法。传统的子带特征方法虽然能提高噪声下的语音识别性能,但通常会使无噪声情况下的识别性能下降。新方法提取感知线性预测(PLP)特征和子带特征,分别进行识别,然后在识别概率层将两者相结合。通过E-Set在NoiseX92下的白噪声的识别实验表明,新方法不仅具有更好的抗噪性能,而且同时能提高无噪声情况下的识别性能。 相似文献