首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 48 毫秒
1.
通过建立一种新的混合模型——SVM-GMM模型,用以提高说话人辨认的识别率。其中介绍了高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,指出了高斯混合模型和支持向量机在实际应用中的不足之处,并针对这两种模型各自的特点,提出了将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量机(SVM)模型的概率输出,并建立了SVM-GMM混合模型。通过实验对比,验证了使用SVM-GMM模型能有效的提高系统识别率。  相似文献   

2.
建立一种新的混合模型-SVM-GMM模型,用以提高说话人辨认的识别率。阐述高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,分别指出高斯混合模型和支持向量机在实际应用中的不足之处,并针对两种模型的特点,提出将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量(SVM)模型的概率输出,并建立SVM-GMM混合模型。通过实验对比,验证使用SVM-GMM模型能有效地提高系统识别率。  相似文献   

3.
运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。  相似文献   

4.
目前说话人识别系统的识别率已经达到较高的水平,但是在应用系统的整合方面还存在一定的问题,比如其算法的复杂度高,不易于低成本的硬件实现等都限制其达到普及化.针对这样的问题,提出一种高性能、结构简单的基于自组织映射(SOFMNN)和概率神经网络(PNN)的混合神经网络分类器以取代目前常用的高斯混合模型(GMM)分类器.实验结果表明,混合神经网络分类器在识别率、识别速度和存储量上都优于高斯混合模型分类器.混合神经网络模型是一种高性能、高效率的说话人识别系统,该系统在说话人识别中将会有很好实用价值.  相似文献   

5.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

6.
为了提高基于高斯混合模型-通用背景模型(GMM UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了459%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM UBM系统的运行效率.  相似文献   

7.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

8.
为了解决传统高斯混合模型GMM(Gaussian m ixture model)的训练方法对模型初值十分敏感、在实际训练中极易得到局部最优模型参数的问题,提出了一种GMM模型参数训练的新方法。将遗传算法与基于模糊聚类分析的GMM参数估计相结合,形成一种新的混合算法,对模型参数进行全局优化,提高了参数估计的准确性。采用自适应交叉和变异算子,同时利用模糊最小目标函数FMOF(FuzzyM inimum Objection Function)准则对模型参数进行重估,提高了算法的搜索效率,加快了算法的收敛速度。使用PKU-SRSC语音数据库进行了与文本无关的说话人辨认实验。实验表明,与传统的GMM训练方法和最大似然估计方法相比,本文方法可以得到更优的模型参数,同时识别率也有所提高。  相似文献   

9.
说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大.本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现.测试结果表明,说话人辨认识别率达到96%以上.  相似文献   

10.
基于编码比特流的说话人识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。  相似文献   

11.
本文提出了一种基于GMM(Gaussian Mixture Model)的说话人分类算法,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明,该算法计算量小、实现速度快,能够提高系统的识别率,扩大应用人群范围,在中小词汇表识别系统中有关非常广阔的前景。  相似文献   

12.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

13.
对于两高斯混合分布,很难求参数的极大似然估计,当然也不便于影响分析.为此,这里通过引入遗失数据并利用EM算法,将局部影响分析建立在完全数据的似然函数基础上,并分析了一种特殊扰动对几个有代表性的参数的估计的影响、且以一例示之.  相似文献   

14.
基于核K-均值聚类和支持向量机结合的说话人识别方法   总被引:1,自引:0,他引:1  
提出了基于核K-均值聚类方法与支持向量机结合的说话人识别方法,为每两个人建立一个支持向量机,对支持向量机输入的语音信号先进行核K-均值聚类,并选取有效样本作为支持向量机的输入,本文提出的聚类方法能够去更好的聚类并约简数据,提高了识别率.实验比较了在用支持向量机作为分类器的情况下,该核聚类与传统聚类方法的训练速度和识别性能,验证了本文提出方法的有效性.  相似文献   

15.
矢量量化(VQ)是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。  相似文献   

16.
说话人识别是根据人的声音来识别人身份的一种生物认证技术。文章采用VC平台利用VQ和HMM技术实现了说话人身份认证功能。并用遗传算法改进了Baum-Welch算法,通过实验验证了改进的HMM算法识别的效率有所提高。  相似文献   

17.
鉴于传统的三帧差分法(TFDM)在检测结果上有检测目标不完整的问题,提出了一种将TFDM与混合高斯模型(GMM)相结合的运动目标检测方法(TFDMGMM算法)。该方法用多个GMM的加权表示每一个背景像素,再结合TFDM判别是前景还是背景。实验结果表明,与单独的TFDM和GMM算法相比,既能得到相对完整的运动目标,又能减小噪声等外部干扰带来的影响。  相似文献   

18.
针对传统高斯模型实时性差的问题,该文提出了一种快速的背景更新策略.首先对彩色图像建立混合高斯模型,根据场景中象素点的稳定性来调整模型参数的更新速度;其次利用混合颜色空间的阴影检测算法消除前景图像的运动阴影;最后对该文方法进行了验证性实验,结果表明提出的运动目标检测方法有效、实时性好、对光照有较强鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号