首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
针对噪声环境下说话人识别率低的问题,提出一种基于α GMM聚类和SVM的说话人确认算法.首先计算每位注册话者的α GMM模型,并计算模型间的α散度,然后以该散度设计聚类算法,对话者的α GMM模型进行聚类,得到各个类别的聚类中心模型用于训练SVM,进而得到最终识别结果.仿真实验结果表明,该算法相比于传统GMM和SVM具有更高的识别性能和良好的鲁棒性.  相似文献   

2.
针对预先给定参数求解共同向量所存在的不足,提出了一种基于共同向量的非常态语音说话人识别算法,首先,通过系统识别率自适应调整求解共同向量的参数;然后,将系统识别率最高的参数视为最优参数,为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人分类。实验结果表明:该算法所提取的共同向量,对轻微感冒语音说话人识别率为85.4%,比对特征不进行处理的GMM算法、SVM和结合共同向量的GMM算法的识别率分别提高了16.9%、15.2%和3.2%。  相似文献   

3.
万洪杰  杜利民  邓浩江 《计算机应用》2005,25(6):1334-1335,1338
基于贝叶斯网络基础理论,并针对与文本无关说话人识别任务,构造了一种用于说话人识别的贝叶斯网络结构,给出了该网络模型的构造和参数估计方法,提出了进行说话人识别时进行推理和分类预测的算法。通过与传统的混合高斯模型(GMM)的实验类比,该贝叶斯网络模型能够在同样的训练和测试数据情况下识别率平均相对提高30%。  相似文献   

4.
针对同类语音数据的相似性和不同类数据具有不同几何距离的特点,提出了一种基于GMMSVM的说话人识别系统。该系统结合了GMM和SVM的优点,解决了GMM在语音数据较小时不能区分数据间的差异性及SVM在处理大量数据时识别率下降的问题;采用改进的K-Means算法实现模型参数初始化,提高了参数精度。试验结果表明,基于GMM-SVM的说话人识别系统较单独采用GMM或SVM的系统具有更好的识别率和鲁棒性。  相似文献   

5.
为了提高说话人识别的性能,提出一种基于GMM模型自适应说话人识别方法。该方法能自动根据不同的说话人选取不同时长的语音进行识别,从提取语音特征和计算识别概率两方面减少识别时间,在不降低识别率的前提下,比传统识别方法识别速度有大幅度提高。实验仿真表明,在保持正确识别率97%以上的情况下,总识别速度可提高4倍左右。该方法特别适合基于GMM的大集合说话人识别。  相似文献   

6.
高斯序列核支持向量机用于说话人识别   总被引:3,自引:1,他引:2       下载免费PDF全文
说话人识别问题具有重要的理论价值和深远的实用意义,在研究支持向量机核方法理论的基础上,将其与传统高斯混合模型(GMM)相结合构建成基于高斯序列核的支持向量机(SVM)。SVM的灵活性和强大分类能力主要在于可以根据要处理的问题来相应的选取核函数。在识别的过程中引入特征空间归正技术NAP(Nuisance Attribute Projection)对同一说话人在不同信道和环境所带来的特征差异进行弥补。用美国国家标准与技术研究所(NIST)2004年评测数据集进行实验,结果表明该方法可以大幅度提高识别率。  相似文献   

7.
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。  相似文献   

8.
支持向量机(SVM)是一种统计学习方法。针对蒙古语说话人识别问题,实验中采用基于高斯核函数的SVM比较了MFCC和MFCC+△MFCC不同特征参数选取时的识别率。实验结果表明,在文本有关情况下,当蒙古语说话内容为0~9的发音时,MFCC+△MFCC优于MFCC,使用SVM算法的识别率能够满足说话人识别的实际要求。  相似文献   

9.
针对传统支持向量机(SVM)在说话人识别中运算量过大的问题,提出了VQ-MAP和SVM融合的说话人识别系统。它应用仅自适应均值向量的最大后验概率矢量量化过程(VQ-MAP),来得到自适应的说话人模型,用此模型中的参数向量作为支持向量应用于SVM来进行说话人识别。用Matlab进行仿真实验,结果表明,基于VQ-MAP和SVM融合的说话人识别系统大大降低了运算量,SVM训练时间短,且具有较高的识别率。  相似文献   

10.
说话人识别的关键在于如何为集合中的每一个人建立一个能表征该说话人个性特征的声学模型,建模方法将会严重影响系统的性能.基于当今与文本无关的话者识别的主流模型——高斯混合模型(Gaussian Mixture Model,GMM)的基础上,从声学的角度剖析了男女发音的差别,以增加说话人之间的差异性为出发点,引入竞争性思想和通用背景模型(Universal Background Model,UBM),提出了具有区分性的GMM的建模方法,克服了传统GMM需要大量训练样本的局限性和UBM将说话人强制服从统一分布的弱点.最后实验的对比结果表明,具有区分性的GMM相比传统的高斯混合模型在识别率上有所提高.  相似文献   

11.
从相关向量机(RVM)和支持向量机(SVM)的相似性以及RVM的稀疏特性出发,将RVM应用于脑电信号(EEG)的情感识别中。针对一对一(OAO)和一对多(OAA)两种多分类方法各自的特点和不足,提出了一种全新的两层多分类模型(OAA-OAO),改进现有OAO算法中无效投票影响最终决策的现象。设计情感EEG信号识别对比实验,验证基于RVM的改进多分类算法在脑电信号情感识别中的应用。对于实验室采集的情感脑电信号,提取其非线性特征(功率谱熵、样本熵和Hurst指数)并采用主成分分析法进行降维。将OAA-OAO-RVM算法分别和OAO-SVM、OAO-RVM两种识别网络进行对比,分析RVM的识别性能以及OAA-OAO多分类算法的分类性能。结果表明,采用降维后的最优特征集合作为识别网络的输入向量得到的识别性能更高,且RVM表现出的性能优于SVM。同时,改进后的OAA-OAO算法较传统OAO模型的平均识别率提高了7.89%,证明OAA-OAO算法可有效去除一部分无效投票从而使分类精度得到显著提高,验证了此模型是一种有效的多分类模型。  相似文献   

12.
支持向量机参数是影响其性能的重要因素,为了进一步提高支持向量机分类精度和泛化能力,提出了基于差分进化算法的SVM参数选择。以样本误判率最小为优化准则,利用差分进化算法对SVM参数进行优化选择。实验结果表明,利用差分进化算法选择SVM参数,加快了参数搜索的速度,提高了SVM分类精度,该方法具有良好的鲁棒性和较强的全局寻优能力。  相似文献   

13.
语音情感识别日益受到人们的关注,在社会生活中发挥着重要作用。为了提高语音情感的识别率,提出一种改进的灰狼算法(Grey Wolf Optimizer,GWO)优化支持向量机(Support Vector Machine,SVM)的分类模型(IGWO-SVM)。介绍了灰狼算法的基本理论;嵌入选择算子和引入非线性收敛因子来提升IGWO的寻优性能;采用IGWO优化SVM参数,进而建立语音情感的分类模型。通过10个基准测试函数的仿真实验,验证了IGWO性能优于GWO。对于参比模型,IGWO-SVM模型能够有效提高语音情感的识别率。  相似文献   

14.
为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型(Gaussian Mixture Model,GMM)作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。  相似文献   

15.
支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SVM的分类效果。实验表明,新方法是有效的,其性能优于基于GLDS核的SVM系统。  相似文献   

16.
Most state-of-the-art speaker recognition systems are based on discriminative learning approaches. On the other hand, generative Gaussian mixture models (GMM) have been widely used in speaker recognition during the last decades. In an earlier work, we proposed an algorithm for discriminative training of GMM with diagonal covariances under a large margin criterion. In this paper, we propose an improvement of this algorithm, which has the major advantage of being computationally highly efficient, thus well suited to handle large-scale databases. We also develop a new strategy to detect and handle the outliers that occur in the training data. To evaluate the performances of our new algorithm, we carry out full NIST speaker identification and verification tasks using NIST-SRE’2006 data, in a Symmetrical Factor Analysis compensation scheme. The results show that our system significantly outperforms the traditional discriminative support vector machines (SVM)-based system of SVM-GMM supervectors, in the two speaker recognition tasks.  相似文献   

17.
张志平  汪庆淼 《计算机工程》2010,36(23):139-141,145
根据隐马尔可夫模型(HMM)适用于处理连续动态序列信号、支持向量机(SVM)与K近邻分类器(KNN)擅长模式分类的特点,设计一种(HMM+KNN)+SVM的混合分类器。利用HMM与KNN对测试样本进行判决。当判决结果相同时,直接输出判决结果,否则引入SVM对测试样本进行再判决。实验结果表明,该方法所确定的分类器优于单一的分类器判决,能有效实现表情识别。  相似文献   

18.
为了提高人脸识别效率,提出了一种基于PCA、LDA和SVM算法融合的人脸识别方法。使用主成分分析(PCA)将人脸图像变换到新的特征空间中,消除图像特征间的相关性和噪声,提取人脸全局特征,在实验阶段取较多的投影方向使其尽可能多的保持原始信息;使用线性判别分析(LDA)算法进一步投影变换降低数据维度;使用支持向量机(SVM)分类识别。将PCA、LDA和SVM三种算法的优点结合起来,在ORL数据库上进行仿真实验,结果表明该方法的识别率可达99.0%。  相似文献   

19.
综合考虑识别率、时间复杂度以及鲁棒性,提出一种边缘、纹理、颜色多特征融合和支持向量机(SVM)的交通标志识别算法。通过提取能够描述交通标志图像边缘信息的方向梯度直方图(HOG)特征并进行统计平均,与能够表示标志图像内部纹理信息的局部二值模式(LBP)特征融合得到降维后的HOG-maxLBP特征,再级联交通标志的颜色特征作为最终的特征向量,最后利用SVM进行交通标志训练和分类。实验结果表明,该算法不仅提高了交通标志的识别率,而且降低了时间复杂度,增强了系统鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号