首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
在基于GMM的与文本无关说话人识别系统中考虑性别差异,提出了把不同性别的说话人特征参数归成不同的两个子集,识别时先判断待识别说话人特征是属于哪个性别子集后,再在相应的子集中进行识别的方法。实验结果表明,该方法能改善基于GMM的与文本无关说话人识别系统的识别率。  相似文献   

2.
采用帧概率变换的与文本无关说话人识别系统的实现   总被引:4,自引:0,他引:4  
从基于GMM的与文本无关说话人识别系统的帧似然概率的统计特性出发,提出了一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论推导和实验结果表明,与GMM常用的最大似然(ML)变换相比,该变换能使系统降低误识率达8.6%,因此,证明了该变换能够改善基于GMM的与文本无关说话人识别系统的识别率。  相似文献   

3.
基于与文本无关说话人识别最常用的模型一一高斯混合模型(GMM)的输出帧似然概率的统计特性,提出了一种非线性变换方法一一似然得分补偿法。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该方法可降低误识率达20%。结果还表明:似然得分补偿法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、环境对系统识别构成影响从而导致识别模型失配情况下,需要对模型的得分进行补偿的局限。  相似文献   

4.
黄伟  戴蓓蒨  李辉 《电子与信息学报》2004,26(10):1607-1612
该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合。在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。  相似文献   

5.
赵振东  张静  李圆  胡喜梅 《通信技术》2009,42(10):192-193
提出了基于高斯混合模型(GMM)说话人分类的分级说话人识别系统,同时将小波神经网络(WNN)引入到子识别系统中。分别对未分级说话人识别系统和分级说话人识别系统进行了比较。仿真实验结果表明,分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度。  相似文献   

6.
说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能。基于当今与文本无关的话者识别的主流模型——高斯混合模型(Gaussian Mixture Model,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(Universal Background Model,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点。最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高。  相似文献   

7.
介绍了一个基于GMM实时说话人识别系统的设计与实现,系统具有实时说话人辨认和实时说话人确认功能。在实验室条件下,对不同的高斯混合密度个数及采样率进行了测试,测试了模型的自适应性能。实验表明系统具有较好的识别准确率。  相似文献   

8.
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人数和识别速度,在43人的语音识别中,识别率达到97.67%.  相似文献   

9.
介绍说话人识别技术发展情况,阐述包括特征提取、识别算法和区分算法在内的文本无关说话人识别系统的整体技术框架和基本工作原理针对文本无关说话人识别相关技术给出了近几年主要发展的高斯超向量—支持向量机模型(GSV-SVM)、联合因子分析模型(JFA)和鉴别性向量(i-vector)模型,并对3种模型进行了分析比较:指出GSV-SVM模型可以提高识别系统性能;JFA模型能提高系统性能但计算量过大,难以实现应用;i-vector模型降低了计算量,并能提高识别精确度和效率,是目前的研究热点。最后指出当前文本无关说话人识别的研究难点和热点。  相似文献   

10.
张庆芳  赵鹤鸣  苏秦 《信号处理》2005,21(Z1):200-203
与文本无关的说话人识别方法是当前说话人识别技术的研究重点.本文将自组织特征映射(SOFM)网络用于矢量量化中码书的形成,改进了训练算法,并基于改进算法进行了与文本无关的说话人识别.经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率.  相似文献   

11.
基于概率DP匹配法的噪声环境下说话人识别方法的研究   总被引:1,自引:0,他引:1  
王吉林  赵力  邹采荣 《电声技术》2005,(8):47-49,66
提出了一种在噪声环境下利用复数语音帧段主分量特征输入的概率DP匹配的说话人识别算法。通过对噪吉环境下与文本无关的说话人识别实验,验证了这种方法的有效性。  相似文献   

12.
基于帧变换的与文本无关语种辨识系统的实现   总被引:1,自引:1,他引:0  
从基于GMM的与文本无关语种辨识系统的帧似然概率的统计特性出发,提出了针对语种辨识的GMM模型训练的新方法以及一种对目标和非目标模型帧似然概率进行补偿变换的方法。理论分析和实验结果表明,与GMM常用的最大似然(ME)变换相比,该变换能使系统提高辨识率达2.0%,因此,证明了该变换能够改善基于GMM的语种辨识系统的识别率。  相似文献   

13.
基于HMM的说话人辨认系统及其改进   总被引:2,自引:0,他引:2  
对基于隐马尔可夫模型(HMM)的说话人辨认系统进行了讨论,完成了系统设计。对系统中矢量量化这一关键性环节进行了改进,提出了一种新的基于遗传算法的码本生成方法。测试结果表明,改进后的系统具有较高的正确识别率,特别是在与文本无关的情况下。  相似文献   

14.
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户的语音库上进行系统识别实验,此新型分类技术的训练时间缩短为基线系统的1/50,测试时间缩短为1/12,模型规模缩小为1/6,同时识别性能达到94.7%。  相似文献   

15.
Numerous speech representations have been reported to be useful in speaker recognition. However, there is much less agreement on which speech representation provides a perfect representation of speaker-specific information conveyed in a speech signal. Unlike previous work, we propose an alternative approach to speaker modeling by the simultaneous use of different speech representations in an optimal way. Inspired by our previous empirical studies, we present a soft competition scheme on different speech representations to exploit different speech representations in encoding speaker-specific information. On the basis of this soft competition scheme, we present a parametric statistical model, generalized Gaussian mixture model (GGMM), to characterize a speaker identity based on different speech representations. Moreover, we develop an expectation-maximization algorithm for parameter estimation in the GGMM. The proposed speaker modeling approach has been applied to text-independent speaker recognition and comparative results on the KING speech corpus demonstrate its effectiveness.  相似文献   

16.
结合主分量分析及Fisher准则的说话人识别方法研究   总被引:2,自引:0,他引:2  
本文提出了一种基于主分量分析和Fisher准则的新的Mel频率域特征参数。它是在Mel域频谱的基础上做主分量分析,并且根据Fisher准则,按Fisher比的大小进行特征参量的选择而得到的。它充分的利用了各频带间的相关统计信息,能更紧致有效的区分说话人,这样得到的特征矢量,与传统的按相应特征值进行特征选择的方法相比,在相同维数时具有最大的类别区分度。最后我们实现了一个文本无关的说话人自动识别系统,它的后端采用矢量量化实现聚类分析。在语音库上的实验表明本文的特征矢量在说话人识别上比相同维数的传统特征矢量识别率更高,证实了它紧致、区分度好、冗余信息少的优良性能。  相似文献   

17.
研究了一种基于RASTA-PLP特征分析的与文本无关的话者识别方法。话者模型训练采用的是基于矢量量化的方法,实验验证了该方法的有效性。  相似文献   

18.
基于支持向量机的说话人辨认研究   总被引:10,自引:0,他引:10  
支持向量机是统计学理论的一个重要的学习方法,也是解决模式识别问题的一个有力的工具,本文提出了用支持向量机来解决说话人辨认问题。结合语音信号的特点,解决了大数据量情况下支持向量机的训练问题。支持向量机对两类的分类问题有着突出的优势,本文用两种判决规则将两类问题应用到多类的识别问题。用支持向量机实现了一个与文本无关的说话人辨认系统,实验表明,本方法有良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号