首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 750 毫秒
1.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。  相似文献   

2.
基于高斯混合模型(GaussianMixtureModel,M)间差别的方法是进行说话人聚类的常用的一类方法。该文GM提出两种新颖的GMM差别度量,“类散度”和GMM的相互概率。“类散度”即模型间“离散度”与模型内“离散度”之比,在计算中综合考虑了GMM各个胞腔的权值、均值及方差的影响,全面地反映了高斯混合模型参数的差别。GMM的相互概率即其中一个GMM的参数在另一个GMM下的概率。实验证明,两种方法均能很好地描述GMM间的差别,在说话人聚类实验中表现良好。  相似文献   

3.
支持向量机作为说话人建模方法用于与文本无关的话者确认研究时,如何提取适合SVM训练和测试的特征参数直接影响话者确认系统的性能和效率.根据高斯混合模型(GMM)聚类能力强的特点,提出一种基于自适应GMM聚类的说话人特征参数提取方法,通过自适应的GMM聚类将大样本、混叠严重的M FCC特征参数聚为小样本的、代表说话人个性特征的特征参数,并用于与文本无关的SVM话者确认.在N IST0′4 1side-1side数据库上的实验表明了该方法的有效性.  相似文献   

4.
建立声学模型是说话人识别技术的重要环节.文章介绍了一种改进的GMM算法,将基于样本和核的相似性度量的动态聚类算法与传统高斯混合模型结合起来进行建模,识别辨认时,对语音帧得分进行加权处理.实验表明:改进后的与文本无关的说话人辨认系统无论是在建模时间还是识别效率上都要高于传统的基于GMM的说话人辨认系统.  相似文献   

5.
高斯混合模型(GMM)已广泛地应用于文本无关的说话人识别系统,该方法具有简单高效的特点.但如果GMM模型的高斯混合分量的数目比较多时,整个模型运算的复杂度会比较大.针对这个问题,提出将聚类算法和传统的高斯混合建模结合起来从而优化高斯混合模型,能够有效地提高说话人识别的速度.实验结果验证了这种算法的高效性.  相似文献   

6.
VoIP压缩码流说话人识别研究   总被引:1,自引:0,他引:1  
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。  相似文献   

7.
随着说话人模型数量的增加,说话人识别系统的识别速度下降,不能满足实时性要求。针对这个问题,提出了基于分层识别模型的快速说话人识别方法。将变分法求解的KL散度的近似值作为模型间的相似性度量准则,并设计了说话人模型聚类的方法。结果表明,本文方法能够保证说话人模型聚类结果的有效性,在系统识别率损失很小的情况下,使系统的识别速度得到大幅度提升。  相似文献   

8.
针对同类语音数据的相似性和不同类数据具有不同几何距离的特点,提出了一种基于GMMSVM的说话人识别系统。该系统结合了GMM和SVM的优点,解决了GMM在语音数据较小时不能区分数据间的差异性及SVM在处理大量数据时识别率下降的问题;采用改进的K-Means算法实现模型参数初始化,提高了参数精度。试验结果表明,基于GMM-SVM的说话人识别系统较单独采用GMM或SVM的系统具有更好的识别率和鲁棒性。  相似文献   

9.
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话人模型用GMM方法建立,发话语音时间短暂时GMM的信赖性降低,最终影响说话人聚类精度。针对上述问题,提出引用i-vector说话人相似度的非负值矩阵分解的高精度快速说话人聚类方法。  相似文献   

10.
由于说话人之间声学特征上的差异,可以将来自于不同说话人的语音段按照话者之间的相似程度进行聚类.在语音段长度不等和说话人数目未知的情况下,本文提出了一种基于纯度信息的不同话者语音段的无监督聚类方法.首先为每个语音段分别建立GMM模型,通过模型似然比计算和GLR距离测度获得语音段之间的相似程度,对语音数据集进行无监督的分级聚类.采用纯度信息和BBN算法进行每级聚类的聚类质量和效果计算,并以此进行分级聚类的剪枝选择.文中给出了平行剪枝和最优剪枝两种剪枝方法及剪枝的评估方法.实验表明,该方法具有较好的聚类效果.  相似文献   

11.
陈黎  徐东平 《计算机工程》2011,37(14):172-174
建立一种支持向量机-高斯混合模型(SVM-GMM),用以提高开集说话人识别的识别率。该模型的基本思想是将SVM的分类结果用GMM模型进行确认。由于SVM模型具有较好的分类性能,而GMM模型能够较好地描述类别内部的相似性,因此这2个模型的组合能够优势互补,从而获得较好的识别效果。实验结果表明,使用SVM-GMM模型能有效地提高开集说话人识别的识别率。  相似文献   

12.
提出一种结合统计模型与区分性模型优点的说话人确认方法:基于GMM多维概率输出的SVM话者模型的说话人确认.以目标说话人的GMM模型对一条语音的不同特征分量的概率输出作为特征参数,建立目标说话人的SVM模型.在NIST'05 8conv4w-1conv4w数据库上的实验表明该方法的有效性.  相似文献   

13.
在深入研究核Fisher判别方法的基础上,提出一种新的模糊核Fisher判别算法应用于说话人识别。采用模糊C均值聚类方法选择样本数据的同时,得到样本的模糊隶属度矩阵和聚类中心向量,进而对核Fisher判别算法中的类间离散度矩阵和类内离散度矩阵进行改进,生成模糊核Fisher判别算法,将其应用于说话人语音识别。  相似文献   

14.
提出一种新的基于多约简SVM的说话人辨识方法.先通过基于熵的特征筛选法,对训练样本进行维数约简,并改善聚类性能.然后用基于核的可能性聚类算法(KPCM)在特征空间选择最具有代表性的样本训练约简SVM,减少系统的存储量和训练量.实验结果表明,提出的方法在不影响识别率的情况下提高了识别速度,减少了SVM的计算量.  相似文献   

15.
针对预先给定参数求解共同向量所存在的不足,提出了一种基于共同向量的非常态语音说话人识别算法,首先,通过系统识别率自适应调整求解共同向量的参数;然后,将系统识别率最高的参数视为最优参数,为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人分类。实验结果表明:该算法所提取的共同向量,对轻微感冒语音说话人识别率为85.4%,比对特征不进行处理的GMM算法、SVM和结合共同向量的GMM算法的识别率分别提高了16.9%、15.2%和3.2%。  相似文献   

16.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

17.
提出一种基于三维类内散度的多分类支持向量机的肺部结节识别算法。首先设计可直接处理基于三维矩阵模式的输入样本的多分类SVM,并结合最小类内散度SVM,进一步提出基于三维最小类内散度的多分类SVM。该方法通过直接分析肺部候选结节的三维特征并继承最小类内散度SVM的优点,有效提高分类器的识别精度,降低假阳性。利用其它4种计算机辅助肺部结节检测算法及两位放疗师作为比较,对于来自吉林省肿瘤医院的200组临床病例进行实验,结果证明三维最小类内散度多分类SVM在计算机辅助肺部结节识别中的优越性。  相似文献   

18.
针对目前广泛应用于说话人识别领域的MFCC特征参数包含较少说话人特征信息的问题和SVM分类器选择核函数时受到Mercer准则限制的问题,提出了一种将混沌粒子群算法(CPSO)与核匹配追踪算法(KMP)相结合的说话人识别方法.首先通过CPSO聚类算法将MFCC特征参数进行变换处理,得到精简的MFCC特征参数(SMFCC),然后利用KMP算法对核函数的形式没有任何限制的特性和良好的分类识别性能,对约简后的SMFCC特征参数进行分类训练和识别.仿真实验结果表明,基于CPSO-KMP说话人识别方法相比主流的GMM-UBM方法,在EER性能上相对提高了31%.  相似文献   

19.
姚潇  武妍  王守觉 《计算机科学》2008,35(8):125-128
为实现对说话人特征空间多聚类区的有效识别,提出一种基于并行覆盖前馈优先级网络(PcPONN)的说话人识别方法.该方法以LBG算法生成每个说话人特征空间初始的聚类中心,对本类样本按聚类中心分类后,用前馈优先级神经网络(PONN)对每个聚类区进行并行覆盖.相关实验证明,PCPONN符合说话人特征空间点的分布特点,得到更好的稳定性和更高的识别率.  相似文献   

20.
为了提高说话人识别的性能,提出一种基于GMM模型自适应说话人识别方法。该方法能自动根据不同的说话人选取不同时长的语音进行识别,从提取语音特征和计算识别概率两方面减少识别时间,在不降低识别率的前提下,比传统识别方法识别速度有大幅度提高。实验仿真表明,在保持正确识别率97%以上的情况下,总识别速度可提高4倍左右。该方法特别适合基于GMM的大集合说话人识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号