共查询到20条相似文献,搜索用时 78 毫秒
1.
噪声下差分复合子带语音识别方法 总被引:4,自引:0,他引:4
本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实,提出了 一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰,再将多子带特征识别概率与全带特征识别概率相结合进行综合判决,以得到最终识别结果。将新方法应用于TIMIT数据包0-9十个英文数字和E-Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。 相似文献
2.
噪声自适应的多数据流复合子带语音识别方法 总被引:3,自引:0,他引:3
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。 相似文献
3.
基于子带能量累积变化的语音端点检测 总被引:1,自引:0,他引:1
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。 相似文献
4.
基于子带卡尔曼滤波的语音增强方法 总被引:1,自引:0,他引:1
与基于短时谱的语音增强方法相比,卡尔曼滤波的语音增强方法是基于语音生成模型的增强方法,这种基于模型的递推计算,导致卡尔曼滤波时的计算量很大.为了减少卡尔曼滤波的计算量,本文给出一种基于子带卡尔曼滤波的语音增强方法.先将带噪语音分解成子带信号,并通过子带频域谱减后估计低阶AR模犁参数,然后利用卡尔曼滤波对子带信号进行滤波,最后由滤波后的子带信号重构全带语音信号,实现语音增强.实验表明该方法在提高语音质量的同时,通过子带分解降低了卡尔曼滤波的模型阶数,明显减少了语音增强系统的计算量,更容易实时实现. 相似文献
5.
在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化.模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境.最大似然线性回归是一种常用的基于变换的模型自适应算法,本文针对最大似然线性回归算法在数据较少时模型参数估计不准确的缺点,提出了基于最大似然子带线性回归的模型自适应算法.该算法将Mel滤波器组的全部通道划分为若干个子带,假设每个子带内多个通道的模型均值分量共享一个线性环境变换关系,以增加可用的数据.实验表明,本文算法可以较好地克服数据稀疏问题,只需要很少的数据即可取得较好的自适应效果,尤其适合于少量数据时的快速模型自适应. 相似文献
6.
7.
根据人耳的听觉感知特性,提出了一种基于子带滤波的优化语音增强方法。基于临界频带设计滤波器将输入信号分成若干子带,依据估计出的每个子带的短时信噪比来对相应子带的时域信号逐帧进行独立的自适应处理后再合成。语音增强性能评估结果表明,有效地去除背景噪声的同时还抑制了音乐噪声,减少了语音的听觉失真,提高了增强语音的可懂度。 相似文献
8.
9.
10.
基于自适应平滑的模糊子带语音端点检测 总被引:1,自引:1,他引:0
作者描述的算法利用自适应平滑算法增强了局部区域间的不连续性,而模糊局部区域内的不连续性,以增强边缘而限制噪声的方式来提供端点检测的鲁棒性,为了减少自适应平滑算法的计算时间,算法通过模糊方法和“双门限”来确定低能量区。实验显示了本算法的有效性和鲁棒性。 相似文献
11.
12.
13.
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测. 相似文献
14.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。 相似文献
15.
16.
通过分析由32人录制的143段汉语耳语语段的耳语频谱,发现同一人的耳语频谱之间的差异远小于不同人的耳语频谱之间的差异.基于此提出了一种通过比较耳语语段的耳语频谱差异,可用于话者识别的方法,并通过实验验证了该方法的可行性. 相似文献
17.
18.
19.
语音识别可实现人机交互和语音控制,在工业控制、消费电子等领域都有广泛应用。结合人发音的生理结构的特点,使用LPMCC(LPC倒谱美尔变换)作为特征向量,采用动态规划算法作为核心识别算法,在TMS320VC5402芯片上实现了特定人、孤立词的高性能实时识别系统。 相似文献
20.
研究了3种背景噪声下与说话人有关的孤立词语音识别方法。即语音前端声学处理法、正则相关分析的谱变换补偿方法和同模极点增加法。实验结果表明,这3种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0 dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。 相似文献