首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于小波变换的鲁棒型特征提取及说话人识别   总被引:4,自引:0,他引:4  
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。  相似文献   

2.
基于鲁棒听觉特征的说话人识别   总被引:3,自引:0,他引:3  
林琳  陈虹  陈建 《电子学报》2013,41(3):619-624
 为了提高噪声环境中说话人识别系统的性能,本文提出了一种鲁棒听觉特征提取的算法,并将其应用到说话人识别系统中.运用自适应压缩Gammachirp滤波器组模拟人耳耳蜗的听觉特性,对输入的语音信号进行频域子带滤波,将得到的对数子带能量作为听觉特征参数.分别运用离散余弦变换和核主成分分析方法,对提取的特征参数进行特征变换,降低特征参数的维数,提高特征参数的噪声鲁棒性和个性表现力.实验结果表明,将提取的新听觉特征参数应用到说话人识别系统中,新特征参数在鲁棒性和识别性能上均优于梅尔倒谱系数和基于Gammatone的听觉特征参数.  相似文献   

3.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

4.
针对语音识别实际应用过程中的噪声问题,给出了一种新的抗噪声的特征提取算法,即先利用小波变换将语音信号进行小波子带分解,再根据人耳的听觉掩蔽效应,由谱压缩的技术,将小波变换后的子带语音信号进行压缩,从而提取其对应的语音特征。通过MATLAB软件建立实验平台,仿真实验结果表明该语音特征可以在噪声环境下得到较高的识别率。新的特征参数即充分利用了小波的抗噪声特性又有效地降低了语音识别中的训练环境和识别环境间的失配,具有抗噪声的特点。  相似文献   

5.
论文研究了小波包变换及LPCC参数的提取,在此基础上,提取了基于小波包变换和LPCC的新参数(DWT-LPCC),并基于GMM系统进行说话人识别实验。结果表明,相对于LPCC参数,DWT-LPCC参数大大提高了噪声环境下的说话人识别率。  相似文献   

6.
基于小波包分析特征参数的说话人识别系统   总被引:5,自引:0,他引:5  
李战明  王贞 《电声技术》2005,(6):46-49,55
介绍了说话人识别系统,研究MFCC提取原理与小波包分析的基础上,提出了一种基于小波包分析的新型语音特征参数WPDC。在研究了WPDC提取算法的基础上,建立了一个神经网络模型的说话人识别系统,实验比较了MFCC与WPDC的识别性能,验证WPDC了具有很高的识别率,是一种很好的语音特征参数。  相似文献   

7.
基于小波包变换和MFCC的说话人识别特征参数   总被引:1,自引:0,他引:1  
陈静  张飞云 《电声技术》2009,33(2):49-51
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。  相似文献   

8.
结合小波变换时频分析的局部化特性和人工神经网的良好学习能力,设计了一种用于声纹识别的人工小波神经网,建立了基于显式小波的网络学习算法.计算机模拟表明,与传统的算法相比,用该小波神经网提高了语音信号分类识别的速度和识别率,而且结构简单易于添加语音模板以便增加识别说话人的人数,是一种可行的语音识别系统.  相似文献   

9.
《现代电子技术》2017,(9):18-21
基于离散小波变换的美尔倒谱系数(DWT-MFCC)~([1])将小波变换引入到MFCC参数的提取中,用DWT代替FFT将语音信号分解为多个频带的小波系数,并将小波系数的频率响应直接拼接为完整频谱后再通过Mel滤波器获得。改进的DWT-MFCC特征提取算法从滤波的角度分析小波分解过程及各子带频谱的变化,提出了新的有效频谱拼接方式。实验结果表明,改进的特征提取算法提高了说话人的识别率;同时,在该算法下随着小波滤波器db N长度的增加,滤波器截止特性变好,识别率也随着增加。  相似文献   

10.
并行子带HMM最大后验概率自适应非线性类估计算法   总被引:1,自引:0,他引:1  
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法.  相似文献   

11.
基于加权特征值补偿的说话人识别   总被引:3,自引:0,他引:3  
于鹏  徐义芳  曹志刚 《信号处理》2002,18(6):513-517
背景噪声的存在,使得说话人识别系统的训练环境和测试环境发生失配,导致系统性能发生急剧下降。本论文提出一种加权特征值补偿算法,把由噪声引起的使带噪语音信号特征值与纯净语音特征值发生偏差的部分去除,从而使进入识别器的特征值接近纯净语音的特征值。在特征值补偿过程中引入了信噪比加权的方法。实验表明,这种方法能够有效的提高说话人识别系统的性能。  相似文献   

12.
张昊慧 《通信技术》2010,43(12):144-146
为了提高说话人识别中语音特征参数的鲁棒性,提取了新的特征参数DWT-MFCC,在提取该参数时利用了新构造的阈值函数,并基于高斯混合模型的说话人识别系统进行实验。实验结果表明,相对于传统的MEL倒谱系数(MFCC)参数,在相同的噪声环境下,DWT-MFCC参数具有更高的说话人识别率。  相似文献   

13.
全刚  肖熙 《电声技术》2010,34(6):45-47
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。  相似文献   

14.
张靖  俞一彪 《通信技术》2020,(3):618-624
说话人识别系统实际应用时,一旦应用环境和训练环境不一致,系统的性能会急剧下降。由于环境噪声的多变性,系统训练时无法预测实际应用中的环境噪声。因此,引入环境自学习和自适应思想,通过改进的矢量泰勒级数(Vector Taylor Series,VTS)刻画环境噪声模型和说话人语音模型之间的统计关系,提出一种具有环境自学习能力的鲁棒说话人识别算法。系统应用中每当环境变化时利用语音输入前采集到的环境噪声信号来迭代更新环境噪声模型参数,进一步基于VTS确立的统计关系,将说话人语音模型自适应到实际应用环境来补偿环境失配的影响。说话人辨认实验结果表明,提出的方法在低信噪比条件下对于不同种类的噪声都能显著提升系统的识别性能。  相似文献   

15.
杜先娜  俞一彪 《信号处理》2016,32(9):1101-1107
针对文本无关非特定说话人年龄识别,本文提出了一种基于有效频带多分辨率特征的统计分析识别方法。输入语音,通过小波包变换进行有效频带分解,然后将各有效频带的小波包系数连接构成一个整体计算美尔频率倒谱系数,得到有效频带多分辨率特征参数WPMFC(Wavelet Packet Mel-Frequency Cepstrum),说话人按年龄划分为儿童、青年、中年和老年四个阶段,并进一步按性别训练各年龄段语音得到8个高斯混合模型。测试语音依据最大似然准则进行识别判决。实验对本文提出的方法与传统的短时谱统计分析方法进行了比较,结果显示本文提出的方法有较好的识别性能,集内平均识别率达到65.17%。同时,实验结果也说明相对语音文本变化的影响,不同说话人发音特征的变化对识别性能的影响更大。   相似文献   

16.
A text independent speaker recognition system based on the Karhunen-Loeve transform, derived from the split-and-merge algorithm, is proposed. The split-and-merge algorithm is applied to speaker data compression in the time domain. A set of experiments is conducted which gives a 91% recognition rate for 100 Mandarin speakers  相似文献   

17.
基于压缩感知的稳健性说话人识别   总被引:1,自引:1,他引:0  
单进  芮贤义 《电声技术》2011,35(2):61-63
阐述了在噪声条件下,将基于压缩感知理论的丢失数据重建技术应用于说话人识别系统的系统前端.首先使用Mel滤波器组将带噪语音信号转换成Mel频谱,然后利用带噪MeI谱中可靠数据重建不可靠数据,最后从重建的Mel频谱中提取Mel倒谱特征参数用于说话人识别.稳健性实验结果表明,该方法能够提高在噪声环境下说话人系统的识别率.  相似文献   

18.
We consider the feature recombination technique in a multiband approach to speaker identification and verification. To overcome the ineffectiveness of conventional feature recombination in broadband noisy environments, we propose a new subband feature recombination which uses subband likelihoods and a subband reliable‐feature selection technique with an adaptive noise model. In the decision step of speaker recognition, a few very low unreliable feature likelihood scores can cause a speaker recognition system to make an incorrect decision. To overcome this problem, reliable‐feature selection adjusts the likelihood scores of an unreliable feature by comparison with those of an adaptive noise model, which is estimated by the maximum a posteriori adaptation technique using noise features directly obtained from noisy test speech. To evaluate the effectiveness of the proposed methods in noisy environments, we use the TIMIT database and the NTIMIT database, which is the corresponding telephone version of TIMIT database. The proposed subband feature recombination with subband reliable‐feature selection achieves better performance than the conventional feature recombination system with reliable‐feature selection.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号