首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
分析和研究自适应滤波和小波变换法的原理及方法,提出了一种新的综合使用自适应滤波和小波变换法的语音降噪方法。该方法首先用仿生小波变换法对带噪声的语音信号进行小波分解,将小渡变换法分离出来的噪声信号作为自适应滤波器的输入。最后选择用最小均方误差(LMS)的自适应算法对带噪声语音信号进行降噪处理,实现了信噪分离,去除语音信号中的噪声信号。实验结果表明,该方法对语音信号有较为明显的降噪效果。  相似文献   

2.
噪声下差分复合子带语音识别方法   总被引:4,自引:0,他引:4  
蒋文建  韦岗 《通信学报》2002,23(1):18-24
本文根据子带特征反映语音信号局部特性和全带特征反映语音信号整体特性的事实,提出了 一种差分复合子带语音识别新方法。先用频谱差分减少噪声的干扰,再将多子带特征识别概率与全带特征识别概率相结合进行综合判决,以得到最终识别结果。将新方法应用于TIMIT数据包0-9十个英文数字和E-Set在NoiseX92的白噪声和F16战机噪声下的识别实验。实验结果表明新方法比传统方法识别性能有很大提高。  相似文献   

3.
基于子带能量累积变化的语音端点检测   总被引:1,自引:0,他引:1  
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。  相似文献   

4.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

5.
基于分形理论的语音增强   总被引:1,自引:0,他引:1  
在分析了语音信号与随机噪声在不同尺度上进行小波变换时其传递特性不同的特征表现及其特点之后.给出了一种新的基于分形维数的语音信号增强方法。该方法根据带噪语音信号及子渡重构之后的分形维数不同对语音信号的小波变换系数作不同的阈值处理。既抑制了噪声,又减少了语音段的信息的损失,提高了佶噪比。仿真结果表明,这是一种有效的语音增强、去噪的方法。  相似文献   

6.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

7.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3  
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

8.
提出了一种基于仿生小波变换和模糊推理的变步长自适应滤波语音降噪算法。该算法首先用仿生小波变换法对包含噪声的语音信号进行小波分解,以分离出来的噪声信号作为自适应滤波器的输入,选择基于模糊推理变步长自适应算法对带噪声语音信号进行降噪处理,最终实现语音信号的信噪分离,去除语音信号中的噪声。仿真结果表明,该方法对语音信号有较为明显的降噪效果。  相似文献   

9.
1/f分形噪声的一种多尺度Kalman滤波方法   总被引:2,自引:0,他引:2  
针对淹没在1/f分形噪声中的有用信号恢复问题,提出了一种基于小波变换与Kalman滤波的多尺度滤波算法。首先将带有1/f分形噪声的信号分解成多尺度的子带信号,通过小波变换对1/f分形噪声的白化作用,消除了1/f分形噪声的自相似性和长程相关性。然后在小波域内,利用Kalman滤波实现了噪声和有用信号的分离,估计出了各子带中的有用信号。最后进行小波重构,较好地恢复出淹没在1/f分形噪声中的有用信号。仿真实验表明,使用多尺度Kalman滤波器能有效地抑制分形噪声,显著地提高了信噪比。  相似文献   

10.
基于多尺度Wiener滤波器的分形噪声滤波   总被引:6,自引:2,他引:4       下载免费PDF全文
胡英  杨杰  周越 《电子学报》2003,31(4):560-563
针对淹没在1/f噪声中的有用信号恢复问题,本文提出了一套基于双正交小波变换与Wiener滤波的多尺度滤波算法,并设计出多尺度Wiener滤波器.首先,利用双正交小波变换将带有1/f噪声的信号分解成多尺度的子带信号,通过小波变换对1/f噪声的白化作用,消除了1/f噪声的非平稳性、自相似性和长程相关性.其次,在小波域内,利用Wiener滤波,实现了噪声和有用信号的分离,估计出了各子带中的有用信号.最后,利用双正交小波的精确重构性,较好地恢复出淹没在1/f噪声中的有用信号.仿真实验表明,该滤波器能有效的抑制分形噪声,显著地提高信噪比.  相似文献   

11.
传统多通道补偿算法忽略保护语音特征,容易造成语音结构变形和识别率低等问题。为了解决上述问题,本文提出了一种基于多分辨率小波的单通道语音增强算法。利用多分辨率小波对信号进行分解与重构,提取出语音信号的频谱包络,得到特征点出其信息并依此计算补偿增益,再利用插值算法计算出整个频谱的增益并对其进行响度补偿。仿真实验以及主观性能测试的各项结果均表明该算法能够在对语音进行补偿的同时有效地保护语音特征,提高言语识别率,达到比较理想的效果。   相似文献   

12.
刘菁华 《电声技术》2011,35(9):47-48,54
提出了一种适用于低信噪比下的语音识别算法.该算法在前端利用人耳听觉掩蔽效应进行语音增强,然后提取一种在不需要噪声先验知识,能避免大量计算的情况下能较好地消除系统加性噪声的自相关MFCC(RAS-MFCC)参数,作为语音特征参数进行识别.  相似文献   

13.
根据混沌编码具有联想记忆的特点,本文提出了一种基于混沌编码的语音识别新方法,该方法首先解决了语音特征矢量维数不固定难于进行混沌编码的难题,其次提出了多样本下语音信号特征的选取原则。实验结果表明,新方法对语音的缺损和噪声干扰具有较好的容错能力。  相似文献   

14.
Wavelet transform has been found to be an effective tool for the time-frequency analysis of non-stationary and quasi-stationary signals. Recent years have seen wavelet transform being used for feature extraction in speech recognition applications. In the paper a sub-band feature extraction technique based on an admissible wavelet transform is proposed and the features are modified to make them robust to additive white Gaussian noise. The performance of this system is compared with the conventional mel frequency cepstral coefficients (MFCC) under various signal to noise ratios. The recognition performance based on the eight sub-band features is found to be superior under the noisy conditions compared with MFCC features.  相似文献   

15.
张志华  王炳锡  彭煊 《电声技术》2005,(5):52-54,69
给出一种新的话音检测方法,即在SNR算法的基础上,应用线性判别分析(LDA)对语音特征参数进行降维。在大噪声环境下,该方法提高了系统的稳健性。同时将这种新的方法与基于信噪比(SNR)和基于噪声/语音统计量(N&S STAT)的算法做了比较,实验表明该方法可以提高检测效率。  相似文献   

16.
The use of a speech recognition system with telephone channel environments, or different microphones, requires channel equalisation. In speech recognition, the speech model provides a bank of statistical information that can be used in the channel identification and equalisation process. The authors consider HMM-based channel equalisation, and present results demonstrating that substantial improvement can be obtained through the equalisation process. An alternative method, for speech recognition, is to use a feature set which is more robust to channel distortion. Channel distortions result in an amplitude tilt of the speech cepstrum, and therefore differential cepstral features provide a measure of immunity to channel distortions. In particular the cepstral-time feature matrix, in addition to providing a framework for representing speech dynamics, can be made robust to channel distortions. The authors present results demonstrating that a major advantage of cepstral-time matrices is their channel insensitive character  相似文献   

17.
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将'VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将这种视觉特征与多数据流HMM结合之后,在信噪比为10dB的强噪声情况下,识别率仍可以达到80%以上。  相似文献   

18.
语音信号的Bark子波变换及其在语音识别中的应用   总被引:17,自引:1,他引:16       下载免费PDF全文
付强  易克初 《电子学报》2000,28(10):102-105
本文首先在语音感知实验基础上所得到的Bark尺度概念与子波的构造联系起来,提出了一种语音信号Bark子波及其变换.在感知特性中,它与人耳的听觉系统是直接吻合的:在数学上,它是一种非正交的但却是超完备的,可逆且是自反演的子波变换.应用在语音识别中时,利用子波的局部基性质,取较小的分析帧长,提高了前端处理的时间分辨率.实验表明,所形成的新特征在对辅音区别能力方面明显优于目前应用于广泛的MFCC特征.  相似文献   

19.
This paper introduces an enhanced phoneme-based myoelectric signal (MES) speech recognition system. The system can recognize new words without retraining the phoneme classifier, which is considered to be the main advantage of phoneme-based speech recognition. It is shown that previous systems experience severe performance degradation when new words are added to a testing dataset. To maintain high accuracy with new words, several improvements are proposed. In the proposed MES speech recognition approach, the raw MES is processed by class-specific rotation matrices to spatially decorrelate the data prior to feature extraction in a preprocessing stage. Then, an uncorrelated linear discriminant analysis is used for dimensionality reduction. The resulting data are classified through a hidden Markov model classifier to obtain the phonemic log likelihoods of the phonemes, which are mapped to corresponding words using a word classifier. An average word classification accuracy of 98.533% is achieved over six subjects. The system offers dramatically improved accuracy when expanding a vocabulary, offering promise for robust large-vocabulary myoelectric speech recognition.  相似文献   

20.
杜先娜  俞一彪 《信号处理》2016,32(9):1101-1107
针对文本无关非特定说话人年龄识别,本文提出了一种基于有效频带多分辨率特征的统计分析识别方法。输入语音,通过小波包变换进行有效频带分解,然后将各有效频带的小波包系数连接构成一个整体计算美尔频率倒谱系数,得到有效频带多分辨率特征参数WPMFC(Wavelet Packet Mel-Frequency Cepstrum),说话人按年龄划分为儿童、青年、中年和老年四个阶段,并进一步按性别训练各年龄段语音得到8个高斯混合模型。测试语音依据最大似然准则进行识别判决。实验对本文提出的方法与传统的短时谱统计分析方法进行了比较,结果显示本文提出的方法有较好的识别性能,集内平均识别率达到65.17%。同时,实验结果也说明相对语音文本变化的影响,不同说话人发音特征的变化对识别性能的影响更大。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号