首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于高斯混合模型(GMM)的说话人识别方法通常采用对数似然得分作为测试时判定目标说话人的依据。文章在分析对数似然得分特点的基础上,提出了一种改进方法,提高了测试语音帧对于目标模型和非目标模型得分的相对差值。基于TIMIT数据库的实验证明了采用变换后似然得分的说话人识别系统比采用对数似然得分的系统具有更好的识别性能和抗噪声性能。  相似文献   

2.
基于与文本无关说话人识别最常用的模型一一高斯混合模型(GMM)的输出帧似然概率的统计特性,提出了一种非线性变换方法一一似然得分补偿法。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该方法可降低误识率达20%。结果还表明:似然得分补偿法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、环境对系统识别构成影响从而导致识别模型失配情况下,需要对模型的得分进行补偿的局限。  相似文献   

3.
采用帧概率变换的与文本无关说话人识别系统的实现   总被引:4,自引:0,他引:4  
从基于GMM的与文本无关说话人识别系统的帧似然概率的统计特性出发,提出了一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论推导和实验结果表明,与GMM常用的最大似然(ML)变换相比,该变换能使系统降低误识率达8.6%,因此,证明了该变换能够改善基于GMM的与文本无关说话人识别系统的识别率。  相似文献   

4.
基于帧变换的与文本无关语种辨识系统的实现   总被引:1,自引:1,他引:0  
从基于GMM的与文本无关语种辨识系统的帧似然概率的统计特性出发,提出了针对语种辨识的GMM模型训练的新方法以及一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论分析和实验结果表明,与GMM常用的最大似然(ME)变换相比,该变换能使系统提高辨识率达2.0%,因此,证明了该变换能够改善基于GMM的语种辨识系统的识别率。  相似文献   

5.
针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。  相似文献   

6.
王彪 《电子设计工程》2012,20(6):29-30,33
为了提高语音信号的识别率。提出了一种改进的LPCC参数提取方法。该方法先对语音信号进行预加重、分帧加窗处理。然后进行小波分解,在此基础上提取LPCC参数,从而构成新向量作为每帧信号的特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

7.
该文研究了似然得分归一化方法的原理,建立了基于自适应GMM模型的说话人确认系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了混合归一化的方法。在电话语音条件下,该文比较了不同得分归一化方法对确认系统性能的影响。实验表明,在自适应GMM模型似然比得分的基础上,T-cohort与通用背景模型混合归一化能获得最佳识别效果。当错误拒绝率为5%时,该方法可以获得0.5%的错误接受率,远远低于采用通用背景模型归一化方法的2%。  相似文献   

8.
在基于GMM的语种识别系统中,实际环境和个人因素一直是影响识别率提高的因素。本文从各模型帧似然概率的统计特性出发,提出了一种新的帧似然概率变换方法,它把帧概率按照一定规则变换成权值。识别时不依靠概率的绝对值,而是依靠帧概率在所有其它语种模型中的相对位置来决定模型总得分。理论分析和实验结果表明,同传统方法相比,本文提出的方法能较好地提高语种识别率。  相似文献   

9.
刘健刚  董静 《电子器件》2011,(4):482-484
在基于GMM的语种识别系统中,实际环境和个人因素一直是影响识别率提高的因素.从各模型帧似然概率的统计 特性出发,提出了一种新的帧似然概率变换方法,它把帧概率按照一定规则变换成权值.识别时不依靠概率的绝对值,而是 依靠帧概率在所有其它语种模型中的相对位置来决定模型总得分.理论分析和实验结果表明,同传统方法相比,本文提出的...  相似文献   

10.
提出了一种基于改进GMM模型和韵律联合短时谱的说话人转换方法.通过在训练阶段引入改进的GMM模型,克服传统GMM模型造成的转换语音过平滑现象,并将线谱对频率LSF和基音频率联合起来组成韵律联合短时谱,更准确地刻画说话人的短时频域特征和声腔的共振特性.实验表明,这种方法能够有效地捕捉说话人的个性化特征和韵律特征.另外,在保证变换语音目标倾向性的同时,一定程度上克服了过平滑现象,提高了变换语音的音质.  相似文献   

11.
对于采用高斯混合模型(GMM)的与文本无关的说话人识别,出于模型参数数量和计算量的考虑 GMM的协方差矩阵通常取为对角矩阵形式,并假设观察矢量各维之间是不相关的。然而,这种假设在大多情况下是不成立的。为了使观察矢量空间适合于采用对角协方差的GMM进行拟合,通常采用对参数空间或模型空间进行解相关变换。该文提出了一种改进模型空间解相关的PCA方法,通过直接对GMM的各高斯成分的协方差进行主成分分析,使参数空间分布更符合使用对角化协方差的混合高斯分布,并通过共享PCA变换阵的方法减少参数数量和计算量。在微软语音库上的说话人识别实验表明,该方法取得了比常规的对角协方差GMM系统的最优结果有相对35%的误识率下降。  相似文献   

12.
说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能。基于当今与文本无关的话者识别的主流模型——高斯混合模型(Gaussian Mixture Model,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(Universal Background Model,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点。最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高。  相似文献   

13.
在基于GMM的与文本无关说话人识别系统中考虑性别差异,提出了把不同性别的说话人特征参数归成不同的两个子集,识别时先判断待识别说话人特征是属于哪个性别子集后,再在相应的子集中进行识别的方法。实验结果表明,该方法能改善基于GMM的与文本无关说话人识别系统的识别率。  相似文献   

14.
本文在基于GMM的与文本无关说话人识别系统中考虑性别差异,提出了把不同性别的说话人特征参数归成不同的两个子集,识别时先判断待识别说话人特征是属于哪个性别子集后,再在相应的子集中进行识别的方法。实验结果表明该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。  相似文献   

15.
包永强  赵力  邹采荣 《信号处理》2006,22(6):899-902
噪声是影响语音识别和说话人识别性能的主要因素,目前常用的降噪方法多是针对平稳噪声的,而针对非平稳噪声的降噪方法很少。而在实际环境中,通常的噪声是非平稳的。本文将含噪语音变换到分数傅立叶域上,提出了一种在分数傅立叶变换域上进行线性最优滤波和中值滤波的联合滤波降噪方法。实验结果表明,该方法对含非平稳噪声的语音的降噪效果明显优于维纳滤波,能够有效地降低非平稳噪声的影响,提高非平稳噪声环境下的语音识别和说话人识别性能。  相似文献   

16.
基于MVQM说话人识别系统的DSP实现   总被引:1,自引:1,他引:0  
文章运用TMS320C5416实现了说话人自动识别系统。提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点。通过用VQ误差尺度取代传统GMM的输出概率函数。减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明该方法是有效的。  相似文献   

17.
在说话人识别系统中,能够反映说话人个性的语音特征参数是系统的关键问题之一。本文提出了一种新的说话人识别方法:在小波变换的基础上,借鉴MFCC特征参数的提取,基于GMM模型,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC,实验结果表明,该方法简单可靠,有效可行,具有较高的识别率,与已有方法相比,具有广泛的实用性。  相似文献   

18.
蒋晔  唐振民 《电子学报》2011,39(4):953-957
针对短语音说话人辨认训练语料不充分的特点,对特征参数和GMM模型进行优化和改进,提出一种基于局部模糊PCA的GMM说话人辨认方法.该方法采用特征组合代替单一特征,以提高有效特征维数来弥补特征样本的不足,并用局部模糊PCA对组合特征进行有效降维,在对识别率影响很小的前提下,降低了系统的时空复杂度.本文还对GMM参数初始化...  相似文献   

19.
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。  相似文献   

20.
在说话人识别中,当存在两个或多个发声类似的说话人时,会导致错误识别。为了提高在这种情况下的识别准确率,在音素层次上找出说话人特有的特征,将这些特征的子集构成一个该说话人特有的特征集,然后在这些特征集的基础上用GMM和i-矢量的方法对说话人进行识别。在实验室环境下收集了50个说话人的声音,分别在不同信噪比的环境下进行测试。实验结果表明提出的方法能够提高当存在发声类似的说话人时的识别准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号