首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
针对噪声环境下说话人识别率低的问题,提出一种基于α GMM聚类和SVM的说话人确认算法.首先计算每位注册话者的α GMM模型,并计算模型间的α散度,然后以该散度设计聚类算法,对话者的α GMM模型进行聚类,得到各个类别的聚类中心模型用于训练SVM,进而得到最终识别结果.仿真实验结果表明,该算法相比于传统GMM和SVM具有更高的识别性能和良好的鲁棒性.  相似文献   

2.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

3.
为了提高说话人识别的性能,提出一种基于GMM模型自适应说话人识别方法。该方法能自动根据不同的说话人选取不同时长的语音进行识别,从提取语音特征和计算识别概率两方面减少识别时间,在不降低识别率的前提下,比传统识别方法识别速度有大幅度提高。实验仿真表明,在保持正确识别率97%以上的情况下,总识别速度可提高4倍左右。该方法特别适合基于GMM的大集合说话人识别。  相似文献   

4.
VoIP压缩码流说话人识别研究   总被引:1,自引:0,他引:1  
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。  相似文献   

5.
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法.对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能。通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程.所带来的计算量和存储量的优势.为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路:  相似文献   

6.
如何能够快速准确的实现说话人识别是说话人识别研究的一个重要环节。提出双约简GMM的说话人确认方法,对语音参数进行核K-均值聚类,提取聚类中心的语音特征矢量作为训练数据,并对其进行fisher比约简,提取具有区分力强的维数。实验表明该文提取方法可以减少训练时间,并提高系统的鲁棒性。  相似文献   

7.
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法,对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能.通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程,所带来的计算量和存储量的优势,为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路.  相似文献   

8.
高斯混合模型(GMM)已广泛地应用于文本无关的说话人识别系统,该方法具有简单高效的特点.但如果GMM模型的高斯混合分量的数目比较多时,整个模型运算的复杂度会比较大.针对这个问题,提出将聚类算法和传统的高斯混合建模结合起来从而优化高斯混合模型,能够有效地提高说话人识别的速度.实验结果验证了这种算法的高效性.  相似文献   

9.
基于高斯混合模型(GaussianMixtureModel,M)间差别的方法是进行说话人聚类的常用的一类方法。该文GM提出两种新颖的GMM差别度量,“类散度”和GMM的相互概率。“类散度”即模型间“离散度”与模型内“离散度”之比,在计算中综合考虑了GMM各个胞腔的权值、均值及方差的影响,全面地反映了高斯混合模型参数的差别。GMM的相互概率即其中一个GMM的参数在另一个GMM下的概率。实验证明,两种方法均能很好地描述GMM间的差别,在说话人聚类实验中表现良好。  相似文献   

10.
针对当前基于DSP、ARM等硬核处理器设计的嵌入式说话人识别系统训练和辨认时间长等缺陷,根据MFCC提取过程的特点与遗传聚类算法中适应度计算的原理,提出一种基于SoPC平台与矢量量化原理的说话人识别系统实现方案。经测试,该实现方案在保证识别率前提下,可有效提高训练与识别速度。  相似文献   

11.
针对传统支持向量机(SVM)在说话人识别中运算量过大的问题,提出了VQ-MAP和SVM融合的说话人识别系统。它应用仅自适应均值向量的最大后验概率矢量量化过程(VQ-MAP),来得到自适应的说话人模型,用此模型中的参数向量作为支持向量应用于SVM来进行说话人识别。用Matlab进行仿真实验,结果表明,基于VQ-MAP和SVM融合的说话人识别系统大大降低了运算量,SVM训练时间短,且具有较高的识别率。  相似文献   

12.
为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型(Gaussian Mixture Model,GMM)作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。  相似文献   

13.
提出了一种基于数学统计模型化的说话人归一化训练方法,它将与状态相关的直接均值移动归一化训练方法和MAP/WNR模型自适应方法结合到统一的鲁棒性框架中,为模型自适应方法提供了更加合适的初始模型,在提高自适应速度和保持足够的模型平滑度之间得到了较好的平衡,实验表明,该方法可有效的提高有监督模式下语音识别的鲁棒性。  相似文献   

14.
杨占栋  解梅 《计算机工程》2011,37(24):150-151
在进行人脸识别时,光照、表情、角度等因素的影响会大幅增加数据计算的时空复杂度。为此,提出一种新的图像外观统计模型,在动态形状模型中引入灰度共生矩阵(GLCM),通过计算图像形状对齐情况下的GLCM,建立半动态外观模型。基于ORL人脸数据库的实验结果表明,该模型相比动态外观模型,识别准确率更高,速度更快。  相似文献   

15.
CTM与SVM相结合的文本分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
王燕霞  邓伟 《计算机工程》2010,36(22):203-205
研究一种相关主题模型(CTM)与支持向量机(SVM)相结合的文本分类方法。该方法用CTM对数据集建模以降低数据的维度,用SVM对简化后的文本数据进行分类。为使CTM模型能够较好地对数据集进行建模,在该方法中用DBSCAN聚类方法对数据进行聚类,根据聚类所得到的聚类中心点数目确定CTM模型的主题参数。实验结果表明,该方法可以加快分类速度并提高分类精度。  相似文献   

16.
余巍  李辉 《计算机工程》2011,37(23):162-164
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。  相似文献   

17.
陈黎  徐东平 《计算机工程》2011,37(14):172-174
建立一种支持向量机-高斯混合模型(SVM-GMM),用以提高开集说话人识别的识别率。该模型的基本思想是将SVM的分类结果用GMM模型进行确认。由于SVM模型具有较好的分类性能,而GMM模型能够较好地描述类别内部的相似性,因此这2个模型的组合能够优势互补,从而获得较好的识别效果。实验结果表明,使用SVM-GMM模型能有效地提高开集说话人识别的识别率。  相似文献   

18.
随着说话人模型数量的增加,说话人识别系统的识别速度下降,不能满足实时性要求。针对这个问题,提出了基于分层识别模型的快速说话人识别方法。将变分法求解的KL散度的近似值作为模型间的相似性度量准则,并设计了说话人模型聚类的方法。结果表明,本文方法能够保证说话人模型聚类结果的有效性,在系统识别率损失很小的情况下,使系统的识别速度得到大幅度提升。  相似文献   

19.
传统的说话人识别中,人们往往认为人耳对相位信息不敏感而忽略了相位信息对语音识别的影响。为了验证相位信息对说话人识别的影响,提出了一种提取相位特征参数的方法。分别在纯净语音和带噪语音条件下,基于高斯混合模型,通过将相位特征参数与耳蜗倒谱系数(CFCC)相结合,研究了相位信息对说话人辨识性能的影响。实验结果标明:相位信息在说话人识别中也有着重要的作用,将其应用于说话人辨识系统,可明显提高系统的识别率和鲁棒性。  相似文献   

20.
在应用最小分类错误(MCE)准则对识别说话人的高斯混合模型(GMM)训练中,采用一个权重函数来确定说话人模型参数调整量的权值,使得比较近的竞争说话人模型的权值大,比较远的竞争说话人模型的权值小。并采用梯度概率递减算法来实现损失函数的最小化,有效提高了说话人识别的速度和精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号