首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 800 毫秒
1.
针对说话人识别的GMM模型中参数估计问题,提出了改进的EM算法,利用算法通过对说话人识别系统的实验数据的计算,验证了该算法能提高说话人识别系统的识别率。  相似文献   

2.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

3.
基于VQ-SVM的说话人识别系统   总被引:1,自引:0,他引:1  
说话人识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的,则说话人识别系统可以令人满意地工作。然而,当实际环境中有噪声存在时,说话人识别系统性能急剧下降。为了让说话人识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能,研究了一个将支持向量机(SVM)在矢量量化(VQ)系统上进行二次识别来提高说话人识别率的方法。通过引入阈值自适应,从而提高系统性能。实验表明,在噪声环境下,与VQ,SVM识别方法相比,此方法在对识别速度影响很小的情况下可以使识别率明显提高。此方法具有良好的应用前景和进一步研究的价值。  相似文献   

4.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

5.
与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进,并基于改进算法进行了与文本无关的说话人识别。经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率。  相似文献   

6.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

7.
讨论了以单一矢量量化和基于矢量量化动态规划两种算法为基础的说话人证实方案,简明介绍了语音特征提取,叙述了矢量量化动态规划基本算法,计算机仿真结果表明,通过对每个人的个人性语音信息的分析,矢量量化动态规划算法不但能相当准确地证实一个人的身份,而且能识别出冒名顶替者;此算法在DSP(数字信号处理)上所实现的实时说话人证实系统的证实错误率已达到实际应用水准。  相似文献   

8.
在分析各个Mel子带抗噪性能的基础上,提出了鲁棒性的说话人识别算法,经实验结果证明,在噪声环境下此算法能有效地提高说话人识别系统的识别率。  相似文献   

9.
说话人识别技术(声纹识别技术)以其独特优势在信息安全领域的应用逐渐增大.本文概括叙述了说话人识别的基本概念;介绍了在模拟噪声环境下,采用新特征提取算法的基于GMM的说话人识别系统的设计原理以及实现.测试结果表明,说话人辨认识别率达到96%以上.  相似文献   

10.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

11.
针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.  相似文献   

12.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

13.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

14.
介绍了话者识别技术的国内外最新研究进展情况,文章概要地介绍了所研究的题目和内容,重点讲座了近年来引起普遍关注和兴趣的新探索和新技术,其中包括VQ和Ergodic-HMM方法、与文本无关的识别方法,文本提示型识别方法、参数/距离标准模型匹配技术、校正模型的方法和话者确认中一种先进的阈值方法。虽然在话者识别方面已取得了一些进展和成果,还有许多问题有待于解答、探索,文章的最后给出了十六个话者识别方面公认的世界难题。  相似文献   

15.
说话人识别算法的研究   总被引:2,自引:0,他引:2  
针对说话人识别问题,基于概率神经网络PNN,实验比较MFCC,ΔMFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明,在文本有关情况下,当说话人说话内容为0~9的发音时,ΔMFCC+MFCC优于MFCC,使用PNN算法的识别率能够满足说话人识别的实际要求。  相似文献   

16.
为适应开放场景下说话人识别短时语音的应用需要,本文对说话人识别模型进行优化,提升了模型的准确率和鲁棒性.为了实现对重要频率特征的筛选,提出基于重加权的特征增强层及网络,起到增强特征表达的作用.将人脸识别领域的误分类样本损失函数首次引入到说话人识别领域,提高对困难样本的挖掘能力.提出基于误分类样本挖掘的分类损失与基于小样本学习框架的余弦角度原型损失的组合损失函数,解决了分类损失函数与说话人识别实际评测需求不匹配和度量函数对采样策略依赖性强的问题.实验结果显示,与基准模型相比,性能指标等误率(EER)降低12.45%,最小检测代价函数(minDCF)降低14.09%,取得现有说话人识别领域的优异效果.  相似文献   

17.
说话人识别是根据人的声音来识别人身份的一种生物认证技术。文章采用VC平台利用VQ和HMM技术实现了说话人身份认证功能。并用遗传算法改进了Baum-Welch算法,通过实验验证了改进的HMM算法识别的效率有所提高。  相似文献   

18.
在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明:有效地提高了说话人辨认系统的识别率.  相似文献   

19.
针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明:该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号