共查询到18条相似文献,搜索用时 62 毫秒
1.
为了进一步提高基于高斯混合模型的与文本无关说话人识别系统的识别性能,本文针对高斯混合模型在建模时需要较多的训练数据的缺陷,提
出了一种新的应用于小样本说话人识别系统的与文本无关说话人识别方法,该方法综合考虑了模糊集理论、矢量量化和高斯混合模型的优点,通过用模糊矢量量化误差尺度取代传统高
斯混合模型的输出概率函数,减少了建模时对训练数据量的要求,提高了模型精度和识别速
度。同时由于模糊集理论起到了“数据整形”的作用,所以增强了目标说话人数据的相似性。实验结果表明该方法针对小样本数据的说话人识别系统,识别性能优于传统的基于高斯混合模型的说话人识别系统。 相似文献
2.
基于支撑向量机的说话人确认系统 总被引:2,自引:1,他引:1
支撑向量机(SVM)是一种新的统计学习方法,和以往的学习方法不同的是SVM的学习原则是使结构风险(Structural Risk)最小,而经典的学习方法遵循经验风险(Empirical Risk)最小原则,这使得SVM具有较好的总体性能.文章提出一种基于支撑向量机的文本无关的说话人确认系统,实验表明同基于向量量化(VQ)和高斯混合模式(GMM)的经典方法相比,基于SVM的方法具有更高的区分力和更好的总体性能. 相似文献
3.
基于美国国家科学技术标准局的说话人识别评测任务,提出了快速说话人识别技术框架。在此框架下,低层的声学特征向量首先经过高斯混合建模和非线性映射,转变为高层的高维特征向量(超向量);接着利用区分性分类器支持向量机,对超向量进行分类;最后依据假设检验理论,进行最终判决。相比较传统的说话人识别系统,以超向量作为特征进行分类,比直接采用声学特征更为稳健。实现了一个快速说话人识别系统,并在电话数据集上进行测试,取得了不错的效果。 相似文献
4.
为了提高文本无关的说话人识别系统的性能,提出了基于线性对数似然核函数的说话人识别系统。线性对数似然核函数利用高斯混合模型对频谱特征序列进行压缩;将频谱特征序列之间的相似程度转化为高斯混合模型参数之间的距离;根据距离表达式,利用极化恒等式求得频谱特征序列向高维矢量空间的映射方法;最后,在高维矢量空间,采用支持向量机(SVM)为目标说话人建立模型。在美国国家标准技术署公布的说话人识别数据库上的实验结果表明,所提核函数具有优异的识别性能。 相似文献
5.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。 相似文献
6.
实现了一个基于高斯混合模型(GMM)的说话人辨识系统。GMM是用多个高斯分布的概率密度函数的组合来描述特征矢量在概率空间的分布状况,不同的说话人对应了不同的GMM。模型的训练采取了极大似然估计(ML)的EM方法。并在不同的数据集上实验,得到了好的结果。 相似文献
7.
为提高文本无关说话人识别系统的识别率,提出一种基于总体最小二乘法的无用分量投影算法。利用总体最小二乘法估计的隐含变量考虑无用分量投影矩阵的扰动,并将该扰动最小化,使基于该隐含变量求得的投影矩阵能更好地刻画无用分量空间。在美国国家标准技术署于2008年公布说话人识别数据库上的实验结果验证该方法的有效性。 相似文献
8.
说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。 相似文献
9.
基于说话人聚类和支持向量的说话人确认研究 总被引:2,自引:0,他引:2
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选或选取与目标说话人相近的说话人,采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据,实验表明该方法地与文本无关的说话人确认问题是有效的。 相似文献
10.
文章提出了一种基于支持向量机的乐器识别方法。与其它的模式识别方法不同,支持向量机是专门针对有限样本情况下的一种分类方法,在小样本的情况下,它的准确率一般优于传统的模式识别方法。它是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。实验以乐器的MFCC系数和它的一阶导数为声学特征,建立一个自底向上的二叉树的支持向量机模型。实验表明这种识别方法是一种有效的识别方法,它的准确率高于GMM方法。 相似文献
11.
12.
13.
相关向量机(RVM)分类法使用概率输出克服了支持向量机(SVM)识别速率低的缺点,并且具有更好的稀疏性。但在与文本无关的话者辨别中,大量训练样本数据体现了RVM在模型训练时计算量与内存需求过大的缺点。针对以上特点,提出基于GMM统计特征参数与RVM融合的与文本无关的语者辨别系统,既有效地提取话者特征信息,解决大样本数据下的RVM训练问题,又结合统计模型鲁棒性高和分辨模型辨别效果好的优点。实验结果证明,该系统比基本的GMM系统具有更优的错误辨别率,比GMM/SVM系统具有更高的稀疏性。 相似文献
14.
针对信道失配和统计模型区分性不足而导致话者确认性能下降问题,文中提出一种将因子分析信道失配补偿与支持向量机模型相结合的文本无关话者确认方法。在SVM话者模型前端采用高斯混合模型-背景模型(GMM-UBM)方法对语音特征参数进行聚类和升维,并利用因子分析(FA)方法,对聚类获得的超矢量进行信道补偿后作为基于SVM话者确认的输入特征,从而有效解决SVM用于文本无关话者确认的大样本、升维问题,以及信道失配对性能影响问题。在NIST 06数据库上实验结果表明,文中方法比未做失配补偿的GMM-UBM系统、GMM-SVM系统在等误识率上有50%以上的改善,比做了FA失配补偿的GMM-UBM系统也有15。8%的改善。 相似文献
15.
针对传统支持向量机(SVM)在说话人识别中运算量过大的问题,提出了VQ-MAP和SVM融合的说话人识别系统。它应用仅自适应均值向量的最大后验概率矢量量化过程(VQ-MAP),来得到自适应的说话人模型,用此模型中的参数向量作为支持向量应用于SVM来进行说话人识别。用Matlab进行仿真实验,结果表明,基于VQ-MAP和SVM融合的说话人识别系统大大降低了运算量,SVM训练时间短,且具有较高的识别率。 相似文献
16.
提出了一种基于韵律特征和SVM的文本无关说话人确认系统。采用小波分析方法,从语音信号的MFCC、F0和能量轨迹中提取出超音段韵律特征,通过实验研究三者的韵律特征在特征层的最佳互补融合,得到信号的韵律特征PMFCCFE,用韵律特征的GMM均值超矢量作为参数训练目标话者的SVM模型,以更有效地区分目标话者和冒认话者。在NIST06 8side-1side数据库的实验表明,以短时倒谱参数的GMM-UBM系统为基准,超音段韵律特征的GMM-SVM系统的EER相对下降了57.9%,MinDCF相对下降了41.4%。 相似文献
17.