共查询到20条相似文献,搜索用时 109 毫秒
1.
分析和研究自适应滤波和小波变换法的原理及方法,提出了一种新的综合使用自适应滤波和小波变换法的语音降噪方法。该方法首先用仿生小波变换法对带噪声的语音信号进行小波分解,将小渡变换法分离出来的噪声信号作为自适应滤波器的输入。最后选择用最小均方误差(LMS)的自适应算法对带噪声语音信号进行降噪处理,实现了信噪分离,去除语音信号中的噪声信号。实验结果表明,该方法对语音信号有较为明显的降噪效果。 相似文献
2.
噪声下差分复合子带语音识别方法 总被引:4,自引:0,他引:4
本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实,提出了 一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰,再将多子带特征识别概率与全带特征识别概率相结合进行综合判决,以得到最终识别结果。将新方法应用于TIMIT数据包0-9十个英文数字和E-Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。 相似文献
3.
基于子带能量累积变化的语音端点检测 总被引:1,自引:0,他引:1
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。 相似文献
4.
5.
6.
噪声自适应的多数据流复合子带语音识别方法 总被引:3,自引:0,他引:3
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。 相似文献
7.
基于鲁棒听觉特征的说话人识别 总被引:3,自引:0,他引:3
为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数. 相似文献
8.
9.
1/f分形噪声的一种多尺度Kalman滤波方法 总被引:2,自引:0,他引:2
针对淹没在1/f分形噪声中的有用信号恢复问题,提出了一种基于小波变换与Kalman滤波的多尺度滤波算法。首先将带有1/f分形噪声的信号分解成多尺度的子带信号,通过小波变换对1/f分形噪声的白化作用,消除了1/f分形噪声的自相似性和长程相关性。然后在小波域内,利用Kalman滤波实现了噪声和有用信号的分离,估计出了各子带中的有用信号。最后进行小波重构,较好地恢复出淹没在1/f分形噪声中的有用信号。仿真实验表明,使用多尺度Kalman滤波器能有效地抑制分形噪声,显著地提高了信噪比。 相似文献
10.
针对淹没在1/f噪声中的有用信号恢复问题,本文提出了一套基于双正交小波变换与Wiener滤波的多尺度滤波算法,并设计出多尺度Wiener滤波器.首先,利用双正交小波变换将带有1/f噪声的信号分解成多尺度的子带信号,通过小波变换对1/f噪声的白化作用,消除了1/f噪声的非平稳性、自相似性和长程相关性.其次,在小波域内,利用Wiener滤波,实现了噪声和有用信号的分离,估计出了各子带中的有用信号.最后,利用双正交小波的精确重构性,较好地恢复出淹没在1/f噪声中的有用信号.仿真实验表明,该滤波器能有效的抑制分形噪声,显著地提高信噪比. 相似文献
11.
12.
提出了一种适用于低信噪比下的语音识别算法.该算法在前端利用人耳听觉掩蔽效应进行语音增强,然后提取一种在不需要噪声先验知识,能避免大量计算的情况下能较好地消除系统加性噪声的自相关MFCC(RAS-MFCC)参数,作为语音特征参数进行识别. 相似文献
13.
14.
Wavelet transform has been found to be an effective tool for the time-frequency analysis of non-stationary and quasi-stationary signals. Recent years have seen wavelet transform being used for feature extraction in speech recognition applications. In the paper a sub-band feature extraction technique based on an admissible wavelet transform is proposed and the features are modified to make them robust to additive white Gaussian noise. The performance of this system is compared with the conventional mel frequency cepstral coefficients (MFCC) under various signal to noise ratios. The recognition performance based on the eight sub-band features is found to be superior under the noisy conditions compared with MFCC features. 相似文献
15.
16.
The use of a speech recognition system with telephone channel environments, or different microphones, requires channel equalisation. In speech recognition, the speech model provides a bank of statistical information that can be used in the channel identification and equalisation process. The authors consider HMM-based channel equalisation, and present results demonstrating that substantial improvement can be obtained through the equalisation process. An alternative method, for speech recognition, is to use a feature set which is more robust to channel distortion. Channel distortions result in an amplitude tilt of the speech cepstrum, and therefore differential cepstral features provide a measure of immunity to channel distortions. In particular the cepstral-time feature matrix, in addition to providing a framework for representing speech dynamics, can be made robust to channel distortions. The authors present results demonstrating that a major advantage of cepstral-time matrices is their channel insensitive character 相似文献
17.
一种稳健的基于Visemic LDA的口形动态特征及听视觉语音识别 总被引:4,自引:0,他引:4
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将'VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将这种视觉特征与多数据流HMM结合之后,在信噪比为10dB的强噪声情况下,识别率仍可以达到80%以上。 相似文献
18.
19.
Quan Zhou Ning Jiang Englehart K. Hudgins B. 《IEEE transactions on bio-medical engineering》2009,56(8):2016-2023
This paper introduces an enhanced phoneme-based myoelectric signal (MES) speech recognition system. The system can recognize new words without retraining the phoneme classifier, which is considered to be the main advantage of phoneme-based speech recognition. It is shown that previous systems experience severe performance degradation when new words are added to a testing dataset. To maintain high accuracy with new words, several improvements are proposed. In the proposed MES speech recognition approach, the raw MES is processed by class-specific rotation matrices to spatially decorrelate the data prior to feature extraction in a preprocessing stage. Then, an uncorrelated linear discriminant analysis is used for dimensionality reduction. The resulting data are classified through a hidden Markov model classifier to obtain the phonemic log likelihoods of the phonemes, which are mapped to corresponding words using a word classifier. An average word classification accuracy of 98.533% is achieved over six subjects. The system offers dramatically improved accuracy when expanding a vocabulary, offering promise for robust large-vocabulary myoelectric speech recognition. 相似文献
20.
针对文本无关非特定说话人年龄识别,本文提出了一种基于有效频带多分辨率特征的统计分析识别方法。输入语音,通过小波包变换进行有效频带分解,然后将各有效频带的小波包系数连接构成一个整体计算美尔频率倒谱系数,得到有效频带多分辨率特征参数WPMFC(Wavelet Packet Mel-Frequency Cepstrum),说话人按年龄划分为儿童、青年、中年和老年四个阶段,并进一步按性别训练各年龄段语音得到8个高斯混合模型。测试语音依据最大似然准则进行识别判决。实验对本文提出的方法与传统的短时谱统计分析方法进行了比较,结果显示本文提出的方法有较好的识别性能,集内平均识别率达到65.17%。同时,实验结果也说明相对语音文本变化的影响,不同说话人发音特征的变化对识别性能的影响更大。 相似文献