首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
论文研究了小波包变换及LPCC参数的提取,在此基础上,提取了基于小波包变换和LPCC的新参数(DWT-LPCC),并基于GMM系统进行说话人识别实验。结果表明,相对于LPCC参数,DWT-LPCC参数大大提高了噪声环境下的说话人识别率。  相似文献   

2.
檀蕊莲 《信息技术》2010,34(8):103-104
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

3.
针对说话人识别进行的加权小波去噪方法   总被引:1,自引:1,他引:0  
采用改进的小波去噪方法对含噪语音进行了前端处理,并针对说话人识别的特点,在小波重构之前对各小波系数进行加权处理;识别过程采用GMM识别算法。实验结果显示,相比纯粹使用MFCC作为识别特征的说话人识别提出的方法对于含噪说话人识别有明显的优越性。该方法对实时说话人识别有很好的指导作用。  相似文献   

4.
赵振东  张静  李圆  胡喜梅 《通信技术》2009,42(10):192-193
提出了基于高斯混合模型(GMM)说话人分类的分级说话人识别系统,同时将小波神经网络(WNN)引入到子识别系统中。分别对未分级说话人识别系统和分级说话人识别系统进行了比较。仿真实验结果表明,分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度。  相似文献   

5.
基于小波包变换和MFCC的说话人识别特征参数   总被引:1,自引:0,他引:1  
陈静  张飞云 《电声技术》2009,33(2):49-51
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。  相似文献   

6.
介绍了一个基于GMM实时说话人识别系统的设计与实现,系统具有实时说话人辨认和实时说话人确认功能。在实验室条件下,对不同的高斯混合密度个数及采样率进行了测试,测试了模型的自适应性能。实验表明系统具有较好的识别准确率。  相似文献   

7.
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。  相似文献   

8.
说话人识别的几种方法   总被引:5,自引:1,他引:4  
宁飞  陈频 《电声技术》2001,(12):9-14
以说话人识别的几个关键问题为纲,说明了国内外现有的识别方法和结果,以及存在的问题和难点,并提出了一些新想法。  相似文献   

9.
提出了一种基于改进GMM模型和韵律联合短时谱的说话人转换方法.通过在训练阶段引入改进的GMM模型,克服传统GMM模型造成的转换语音过平滑现象,并将线谱对频率LSF和基音频率联合起来组成韵律联合短时谱,更准确地刻画说话人的短时频域特征和声腔的共振特性.实验表明,这种方法能够有效地捕捉说话人的个性化特征和韵律特征.另外,在保证变换语音目标倾向性的同时,一定程度上克服了过平滑现象,提高了变换语音的音质.  相似文献   

10.
针对与文本无关说话人识别GMM模型中,某些非目标模型的测试帧的模型得分可能会比较高,从而引起误判的问题。从帧似然概率的统计特性出发,提出了一种GMM非线性变换方法。该方法通过对每帧各模型的得分赋予不同的权值,使得得分高的模型权值大,得分低的模型权值小,由于目标模型得分高的帧要多于其它非目标模型,所以这样可以提高目标模型的总得分,降低非目标模型的得分,从而降低误判的可能。理论推导和实验结果表明,该变换方法能够提高GMM说话人识别的识别率。  相似文献   

11.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

12.
基于多特征有效组合的说话人识别   总被引:1,自引:0,他引:1  
通过分析当今说话人识别系统中常用的一些特征参数,以提高说话人识别的识别率为目的,在Matlab 6.5软件环境下提出了将Mel频率倒谱(MFCC)、线性预测倒谱(LPCC)及他们的一阶差分和基音周期等多种特征有效结合进行说话人识别的方法。采用短时自相关法提取基音周期,在识别过程中采用改进的动态规整算法,将模板的匹配过程与检验量的计算分离开,每帧给出一个说话人辨认结果,最后综合各帧的辨认结果,得出最佳匹配结果。经过多次实验证明,采用以上方法使用多特征有效结合比单个使用各种特征效果要好,能在一定程度上提高系统区分说话人的能力。  相似文献   

13.
基于加权特征值补偿的说话人识别   总被引:3,自引:0,他引:3  
于鹏  徐义芳  曹志刚 《信号处理》2002,18(6):513-517
背景噪声的存在,使得说话人识别系统的训练环境和测试环境发生失配,导致系统性能发生急剧下降。本论文提出一种加权特征值补偿算法,把由噪声引起的使带噪语音信号特征值与纯净语音特征值发生偏差的部分去除,从而使进入识别器的特征值接近纯净语音的特征值。在特征值补偿过程中引入了信噪比加权的方法。实验表明,这种方法能够有效的提高说话人识别系统的性能。  相似文献   

14.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

15.
VQ+WNN(Vector Quantization and Wavelet Neural Network)说话人识别系统主要利用VQ进行矢量量化,将量化矢量送到小波神经网络进行说话人训练和识别。经过VQ量化后的特征矢量可以大大减少小波神经网络的运算量,提高网络的收敛速度与识别精度。虽然运算量是可以接受的,但如果在矢量量化之前采用分量处理方法,去除对识别精度影响不大的特征矢量,则可进一步减少运算量,而识别精度基本维持不变。  相似文献   

16.
采用遗传算法的VQ码本设计及说话人识别   总被引:2,自引:0,他引:2  
芮贤义  俞一彪 《信号处理》2005,21(3):289-292
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。  相似文献   

17.
说话人识别综述   总被引:2,自引:0,他引:2  
在分析说话人识别原理和方法的基础上,对近年来说话人识别技术的发展进行了综述。分析了当前说话人识别技术中使用的多种特征和模式识别方法,并对其今后的研究前景和发展方向进行了展望。  相似文献   

18.
介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望.  相似文献   

19.
多数说话人识别方法采用的都是基于对语音信号的静态特征进行分析,忽略了语音信号动态特征对识别性能的影响。而Delta特征是反映语音信号帧间动态特征的重要特征,对LPC和它的Delta特征进行了具体实例求解,并对计算结果进行了分析,探讨了将它用于说话人识别系统的有效性和可行性。  相似文献   

20.
利用遗传算法优越的全局搜索能力对传统DTW算法进行改进,重点研究遗传动态时间规划算法(GA_DTW)的实现机理、编码方式、适应度函数设计、种群初始化、选择机理、交叉运算、变异操作和终止策略。实验结果表明,在孤立词的说话人识别上,该算法具有识别率更高、耗时更少的优点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号