排序方式: 共有24条查询结果,搜索用时 15 毫秒
11.
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。 相似文献
12.
基于GSV-SVM的语种识别方法是目前最为流行的语种识别方法之一,其采用基于通用背景模型GMM-UBM的GSV作为声学模型,支持向量机SVM作为区分模型.大量仿真测试结果表明,GSV在整个系统中占的运算量为80%左右,是算法硬件实现的瓶颈.鉴于此,对基于GSV的硬件实现方法进行了研究,提出了一种快速GSV定点计算方法,其采用addlog运算简化对数似然函数的计算,完成了语种识别的高效定点实现.实验结果表明,该定点方法的识别率与浮点识别基本一致,满足应用要求. 相似文献
13.
14.
针对不同类型数据对目标发音人区分能力不同的现象,在传统系统基础上提出利用UBM模型对测试数据进行分类,使用分类后的似然比得分形成多维特征,在此基础上利用SVM分类器进行声纹密码确认。该方法把传统的似然比检验策略转换成多维特征空间上的二类分类问题。测试与注册数据同信道情况时,在4种手机数据集上,文中系统相对文本相关GMM-UBM声纹密码系统等错误率分别下降41。25%、33。33%、37。49%和26。03%,在交叉信道上系统性能也获得改善。 相似文献
15.
本文提出了一种嵌入时延神经网络(TDNN)的高斯混合背景模型(GMM UBM)说话人确认方法,它集成了作为判别性方法的时延神经网络和作为生成性方法的高斯混合模型各自的优点。该方法利用时延神经网络挖掘特征向量集的时序性,然后把时间信息传递给GMM;并且通过时延网络的变换使需要假设变量独立的最大似然概率(ML)方法更为合理。该方法利用极大似然概率作为训练准则,把高斯混合模型和神经网络作为整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。实验结果表明,采用本文提出的方法结合TNorm比基线系统的等误差率(EER)降低28%。 相似文献
16.
针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作为SVM分类器的特征参数,既利用了GMM表征数据本身统计特性的能力,又保留了SVM判决能力强的特点。在柏林情感语音库与汉语情感语料库上进行的实验结果表明,该方法在语音情感识别上的平均识别率较标准GMM方法提高1.7%3.7%。 相似文献
17.
针对说话人识别实际应用中训练数据不足的问题,选取GMM-UBM作为基准系统模型,用EigenVoice对其作自适应,应用泛化能力较强的多项式核函数和学习能力较强的径向基核函数进行线性加权组合后的组合核函数进行模型参数优化,并用多重网格搜索法确定核函数的最优参数,采用DAG方法实现SVM核函数的多元分类.在仿真实验中评估了线性核、多项式核、径向基核以及组合核函数,实验结果表明,在采用正确的参数前提下,在不同的多分类策略、自适应时间、信噪比和不同的说话人数量的情况下,组合核函数的识别性能明显都优于其它三个单核函数. 相似文献
18.
对于与文本无关短电话语音(小于30S)的话者确认,在特征参数空间上分类并分别建模的方法,会带来多个子系统输出融合的问题。为了得到最终的评分,同时反映出各个子系统之间的非线性关系以及贡献的不同。本文提出了使用支持向量机(Support vector machine,SVM)进行后端评分融合的方法,对输出的两类评分矢量(目标话者和冒认话者)进行分类。在NIST’03数据库上的实验表明,在短语音情况下该方法比评分相加融合方法性能可以相对提高约11%,SVM不仅适用于多子系统的评分级的融合,对其他的多系统多信息的融合也行之有效。 相似文献
19.
目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意义上降低特征参数偏离高斯分布的程度,从而可以用较低混合度的高斯混合模型对其建模。同时,这种映射也是一种无监督规整,因此可以提高系统的鲁棒性及其确认性能。在NIST’03数据库上的实验表明,在使用相同混合度模型的情况下,概率分布规整后的参数相对于变换前的参数系统性能可以提高11%左右。 相似文献
20.
基于SDC特征和GMM-UBM模型的自动语种识别* 总被引:3,自引:1,他引:3
本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。 相似文献