首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。  相似文献   

2.
刘晓燕  傅鹂  周元 《计算机应用与软件》2007,24(11):150-151,203
在研究说话人识别系统时,分别从特征参数的选取和识别训练两种不同角度分析了加权特征向量和群模型在增强系统性能方面的可行性,并采用群模型与加权特征向量相结合的方式建立与文本无关的说话人确认系统.试验结果表明,含加权特征向量的群模型比传统的矢量量化有更高的辨识率,而且错误拒绝率在一定的错误接受率下也有显著降低.  相似文献   

3.
针对训练和测试阶段中的语音数据类型(普通话和四川方言)的不匹配导致说话人确认系统性能下降很大的问题,提出了一种新的建立高斯混合模型(GMM)方法——普通话和四川方言按比例混合建立普通话和四川方言联合GMM的方法,并发现使系统针对普通话和四川方言不匹配导致的性能下降率至很低(2.79%)的比例。实验结果表明,该方法可以有效地加强测试阶段针对语种变化的鲁棒性,可以有效的减少普通话和四川方言在训练和测试阶段的不匹配造成的性能下降率。  相似文献   

4.
基于高斯混合模型的说话人确认系统   总被引:4,自引:1,他引:4  
杨澄宇  赵文  杨鉴 《计算机应用》2001,21(4):7-8,11
由于在人的话音频谱中,低频和较高频段含有较多说话人的个性信息,本文提出一种LPC倒谱的改进算法用于与文本无关的说话人识别,该改进算法通过话音频谱的各频段进行加权,突出说话人的个性信息,从而使说话人更易于区分。  相似文献   

5.
基于支撑向量机的说话人确认系统   总被引:2,自引:1,他引:1  
支撑向量机(SVM)是一种新的统计学习方法,和以往的学习方法不同的是SVM的学习原则是使结构风险(Structural Risk)最小,而经典的学习方法遵循经验风险(Empirical Risk)最小原则,这使得SVM具有较好的总体性能.文章提出一种基于支撑向量机的文本无关的说话人确认系统,实验表明同基于向量量化(VQ)和高斯混合模式(GMM)的经典方法相比,基于SVM的方法具有更高的区分力和更好的总体性能.  相似文献   

6.
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型(GMM)说话人识别系统,提取输入语音的Mel倒谱系数作为观察向量,用GMM算法进行说话人语音模型训练和识别。同时设计基于TMS320DM3730DSP的嵌入式硬件平台,并在该平台上实现所设计的说话人识别系统。为进行性能测试,自行录制相应的语音材料库,录音的人数为38人,其中男19人,女19人。经测试表明,在正常环境下.该设计的说话人系统识别率可达到95%以上。  相似文献   

7.
基于说话人聚类和支持向量的说话人确认研究   总被引:2,自引:0,他引:2  
侯风雷 《计算机应用》2002,22(10):33-35
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选或选取与目标说话人相近的说话人,采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据,实验表明该方法地与文本无关的说话人确认问题是有效的。  相似文献   

8.
在嵌入式系统应用中,如果能够创建仿真环境,并利用仿真环境的优势进行算法的验证、系统的移植、应用程序的设计,就能够极大地提高开发的灵活性,节省开发资源,验证系统的可行性.文巾分析了开放源码的嵌入式系统仿真集成开发环境SkyEye,并实现在该软件平台上基于ARM7TDMI核的AT91EV40仿真开发饭的实时操作系统μC/OS-Ⅱ的移植.把语音识别从试验室推广到实际应用中,在嵌入式系统中进行研究是必然的要求.在该嵌入式软硬什仿真平台上实现说话人识别算法的研究,选取改进了配合于硬件的算法,取得了良好的效果.  相似文献   

9.
说话人识别 ,是指通过说话人的语音来自动识别说话人的身份 ,它主要包括特征提取和模式匹配两个部分。随着计算机技术和人工智能的发展 ,通过说话人识别实现特定场合的实体鉴别已经具有非常重要的研究和应用价值。  相似文献   

10.
针对同类语音数据的相似性和不同类数据具有不同几何距离的特点,提出了一种基于GMMSVM的说话人识别系统。该系统结合了GMM和SVM的优点,解决了GMM在语音数据较小时不能区分数据间的差异性及SVM在处理大量数据时识别率下降的问题;采用改进的K-Means算法实现模型参数初始化,提高了参数精度。试验结果表明,基于GMM-SVM的说话人识别系统较单独采用GMM或SVM的系统具有更好的识别率和鲁棒性。  相似文献   

11.
基于说话人聚类和支持向量机的说话人确认研究   总被引:3,自引:1,他引:3  
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选取或选取与目标说话人相近的说话人。采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据。实验表明该方法对与文本无关的说话人确认问题是有效的。  相似文献   

12.
利用Windows平台与MATLAB软件.设计了一种基于GMM的与文本无关的说话人识别系统,系统包括端点检测,特征提取,参数训练,说话人识别四部分。该系统性能稳定,使用方便,可用于语音信号的频谱分析,实时处理。  相似文献   

13.
陈芬菲 《微处理机》2006,27(4):76-77,79
实现了一个基于高斯混合模型(GMM)的说话人辨识系统。GMM是用多个高斯分布的概率密度函数的组合来描述特征矢量在概率空间的分布状况,不同的说话人对应了不同的GMM。模型的训练采取了极大似然估计(ML)的EM方法。并在不同的数据集上实验,得到了好的结果。  相似文献   

14.
论文介绍了一个基于DSP的说话人确认系统,该系统确认算法建立于高斯混合模型-全局背景模型(GMM-UBM)的基础上,并在特征空间采用一种新的基于信息熵特征融合的算法,实验结果表明在不影响识别率的情况下,该算法计算量比传统的特征关联融合的要减少以上,比归一化融合要少。硬件系统采用高速DSP芯片TMS320C6701,为确认算法的实时实现提供了保证。  相似文献   

15.
通过分析GMM(高斯混合模型)的说话人辨认系统的性能,提出了一种捕捉不同说话人交互信息的人工神经网络(ANN)方法,构成一个GMM/ANN混合说话人辨认系统。实验表明,GMM/ANN混合系统的说话人辨认能够取得比基于GMM和基于MLP(多层感知器)更高的辨认率。  相似文献   

16.
该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。  相似文献   

17.
为了提高噪声中的说话人识别率,根据各维倒谱系数鉴别能力的不同,在识别过程中对GMM(Gauss mixture model)模型的各维分量直接加权,提出了直接倒谱加权的GMM模型,并且研究了在噪声情况下衡量各维特征鉴别能力的新方法。将该方法与MMSE(Minimum mean square error)相融合,对白噪声和地铁噪声进行实验,得到基线系统和MMSE增强系统在不同噪声情况下最优的加权窗函数。试验结果表明,直接倒谱加权GMM能显著提高系统识别精度。  相似文献   

18.
自I-Vector(身份认证矢量)被提出以来,基于I-Vector的说话人确认系统迅速取代了基于GMM超矢量的系统并开始流行。I-Vector-SVM系统作为其中之一,在通常训练样本较少的说话人确认领域有着独特的优势,但其性能受核函数影响较大。因此,基于多核学习(Multiple Kernel Learning,MKL)思想,构建了基于I-Vector的多核学习SVM说话人确认系统,并与I-VectorSVM基线系统进行了性能比较。基于NIST语料库的实验表明,基于I-Vector的多核学习说话人确认系统相对于基线系统可取得一定的性能提升。  相似文献   

19.
GMM文本无关的说话人识别系统研究   总被引:1,自引:2,他引:1       下载免费PDF全文
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。  相似文献   

20.
针对现有说话人识别系统识别率不高,鲁棒性能差的缺点,提出了一种基于超向量的核函数构造方法.通过对超向量进行KL散度变换和L2线性内积变换,分别得到KL散度线性核函数、KL散度非线性核函数以及L2内积核函数.实验结果表明,将这三种核函数分别应用于支持向量机的说话人识别系统,可以得到优于常规核函数的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号