首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大.本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现.测试结果表明,说话人辨认识别率达到96%以上.  相似文献   

2.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

3.
建立一种新的混合模型-SVM-GMM模型,用以提高说话人辨认的识别率。阐述高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,分别指出高斯混合模型和支持向量机在实际应用中的不足之处,并针对两种模型的特点,提出将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量(SVM)模型的概率输出,并建立SVM-GMM混合模型。通过实验对比,验证使用SVM-GMM模型能有效地提高系统识别率。  相似文献   

4.
为了提高基于高斯混合模型-通用背景模型(GMM UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了459%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM UBM系统的运行效率.  相似文献   

5.
本文提出了一种基于GMM(Gaussian Mixture Model)的说话人分类算法,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明,该算法计算量小、实现速度快,能够提高系统的识别率,扩大应用人群范围,在中小词汇表识别系统中有关非常广阔的前景。  相似文献   

6.
针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。  相似文献   

7.
提出了一种基于子带处理多分类器融合的说话人识别方法.宽带语音信号通过Mel滤波器组转变为多个子带信号,对各子带数据独立分析提取相应的特征参数,进而对每个子带分别建立识别模型进行判决,最后利用分类器融合规则,给出总体判决.研究表明,该方法在子带数目选为16时可以得到最好的识别效果,并且在有窄带噪声的情况下,子带多分类器融合法比宽带语音数据建模表现出更好的鲁棒性.  相似文献   

8.
基于正交高斯混合模型的说话人识别研究   总被引:5,自引:0,他引:5       下载免费PDF全文
本文介绍了正交高斯混合模型(OGMM)及其在说话人识别中的具体应用。传统的高斯混合模型(GMM)常常假定协方差矩阵为对角线矩阵,但需大量的混合成来表征分布情况,这将会导致训练量的增加。OGMM的主要思想是传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去,这样得到的对角线协方差矩阵可以更准确地反映分布的情况。基于OGMM的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景。  相似文献   

9.
特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别.  相似文献   

10.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

11.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

12.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

13.
目前说话人识别系统的识别率已经达到较高的水平,但是在应用系统的整合方面还存在一定的问题,比如其算法的复杂度高,不易于低成本的硬件实现等都限制其达到普及化.针对这样的问题,提出一种高性能、结构简单的基于自组织映射(SOFMNN)和概率神经网络(PNN)的混合神经网络分类器以取代目前常用的高斯混合模型(GMM)分类器.实验结果表明,混合神经网络分类器在识别率、识别速度和存储量上都优于高斯混合模型分类器.混合神经网络模型是一种高性能、高效率的说话人识别系统,该系统在说话人识别中将会有很好实用价值.  相似文献   

14.
在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明:有效地提高了说话人辨认系统的识别率.  相似文献   

15.
Affinitypropagation(AP)聚类算法是通过消息传递实现聚类的,不需要事先指定聚类数目.对于规模较大的数据集,AP聚类是一种快速、有效的聚类方法,这是其他传统聚类方法所不能及的,如K—centers方法.研究了AP算法的原理和步骤,通过实验,证明了AP聚类算法的实用性和有效性.  相似文献   

16.

针对高斯混合模型(Gaussian mixture model,GMM)参数选取效率较低的问题,提出了一种在基于GMM的轨迹模仿学习表征中综合求解GMM参数估计的方法. 该方法基于多中心聚类算法中的最大最小距离算法改进\t\t\t\t\tk-means算法,得到最优初始聚类中心,并基于贝叶斯信息准则(Bayesian information criterion,BIC)通过遗传算法优化求解,同时获取GMM的4个重要参数. 该方法通过提高划分初始数据集的效率,在优化初始聚类中心基础上确定混合模型个数,有效地避免了因为初值敏感而导致的局部极值问题. 通过多组仿真实验验证了该方法的有效性.\t\t\t\t

  相似文献   

17.
提出了一种基于子带处理多分类器融合的说话人识别方法 .宽带语音信号通过Mel滤波器组转变为多个子带信号 ,对各子带数据独立分析提取相应的特征参数 ,进而对每个子带分别建立识别模型进行判决 ,最后利用分类器融合规则 ,给出总体判决 .研究表明 ,该方法在子带数目选为 16时可以得到最好的识别效果 ,并且在有窄带噪声的情况下 ,子带多分类器融合法比宽带语音数据建模表现出更好的鲁棒性 .  相似文献   

18.
在书写任务中的基于轨迹匹配的模仿学习   总被引:1,自引:0,他引:1  
针对书写任务中运动轨迹较复杂的问题,引入基于轨迹匹配的模仿学习算法对书写轨迹进行表征和泛化,进而实现机器人书写技能的获取。机器人从示教者处获取示教数据,利用高斯混合模型( Gaussian mixture model, GMM)进行编码,学习示教行为的本质特征,通过高斯混合回归进行泛化处理,实现行为再现。实验结果表明:该方法具有良好的行为编码能力和抗干扰性,能够实现轨迹可连续的汉字书写,通过对GMM的扩展能够进行多任务学习,进而实现轨迹不可连续汉字的书写,泛化效果较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号