首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
相关向量机及在说话人识别应用中的研究   总被引:2,自引:0,他引:2  
对基于相关向量机和高斯混合模型的说话人识别算法的模型和特征空间进行了一系列的研究。与一些基于语音帧的说话人识别算法相比,该算法将GMM算法作为底层的语音特征提取,从而实现对语音整体上的处理,对常用的两种语音特征美尔频率倒频系数和瞬时频率的表现进行了对比研究;同时,该算法充分利用了相关向量机的所提供的高泛化性、核函数功能和结果的高稀疏性。基于Chains和AHUMADA两个专门用于说话人识别的语音库的仿真表明,该算法在减少相对误差和减少计算量方面有较大的优势。  相似文献   

2.
随着当前电子商务和金融交易领域的发展,用户身份认证的应用变得越来越广泛。结合实际,本文构建了一种基于人脸和语音的混合型身份认证系统,分别提出了基于重建误差分类器的特征脸确认算法和基于高斯混合(Gaussian mixture models,GMM)说话人确认算法;最后在分数层进行融合,提出了基于正交多项式核函数的支持向量机。实验结果表明,该方法在分类、泛化能力和减少支持向量数目方面均取得了良好的效果,最终获得了较小的等误差率。  相似文献   

3.
随着当前电子商务和金融交易领域的发展,用户身份认证的应用变得越来越广泛.结合实际,本文构建了一种基于人脸和语音的混合型身份认证系统,分别提出了基于重建误差分类器的特征脸确认算法和基于高斯混合 (Gaussian mixture models, GMM)说话人确认算法;最后在分数层进行融合,提出了基于正交多项式核函数的支持向量机.实验结果表明,该方法在分类、泛化能力和减少支持向量数目方面均取得了良好的效果,最终获得了较小的等误差率.  相似文献   

4.
通过建立一种新的混合模型——SVM-GMM模型,用以提高说话人辨认的识别率。其中介绍了高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,指出了高斯混合模型和支持向量机在实际应用中的不足之处,并针对这两种模型各自的特点,提出了将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量机(SVM)模型的概率输出,并建立了SVM-GMM混合模型。通过实验对比,验证了使用SVM-GMM模型能有效的提高系统识别率。  相似文献   

5.
基于正交高斯混合模型的说话人识别研究   总被引:5,自引:0,他引:5       下载免费PDF全文
本文介绍了正交高斯混合模型(OGMM)及其在说话人识别中的具体应用。传统的高斯混合模型(GMM)常常假定协方差矩阵为对角线矩阵,但需大量的混合成来表征分布情况,这将会导致训练量的增加。OGMM的主要思想是传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去,这样得到的对角线协方差矩阵可以更准确地反映分布的情况。基于OGMM的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景。  相似文献   

6.
基于核K-均值聚类和支持向量机结合的说话人识别方法   总被引:1,自引:0,他引:1  
提出了基于核K-均值聚类方法与支持向量机结合的说话人识别方法,为每两个人建立一个支持向量机,对支持向量机输入的语音信号先进行核K-均值聚类,并选取有效样本作为支持向量机的输入,本文提出的聚类方法能够去更好的聚类并约简数据,提高了识别率.实验比较了在用支持向量机作为分类器的情况下,该核聚类与传统聚类方法的训练速度和识别性能,验证了本文提出方法的有效性.  相似文献   

7.
现有说话人识别算法普遍受信道因素的干扰,为了提高算法的准确率,在特征级利用特征弯折算法对语音特征参数进行处理,在模型级利用因子分析技术对说话人混合高斯模型(GMM)进行信道处理。对端点进行检测后,利用特征弯折算法对语音特征参数梅尔倒谱系数(MFCC)进行处理,去除线性信道和背景噪声的影响,并建立说话人GMM。然后利用因子分析技术拟合说话人特征空间与信道空间的差异,去除信道因子的影响。最后提取高斯超向量并通过支持向量机(SVM)得到识别结果。实验结果证明了信道补偿算法与GMM-SVM相结合能获得更好的识别率,并能保证算法的鲁棒性。  相似文献   

8.
建立一种新的混合模型-SVM-GMM模型,用以提高说话人辨认的识别率。阐述高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,分别指出高斯混合模型和支持向量机在实际应用中的不足之处,并针对两种模型的特点,提出将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量(SVM)模型的概率输出,并建立SVM-GMM混合模型。通过实验对比,验证使用SVM-GMM模型能有效地提高系统识别率。  相似文献   

9.
支持向量机(SVM)的推广能力依赖于核函数形式及核参数和惩罚因子的选取,即模型选择.在分析参数对分类器识别精度的影响基础上,提出了基于遗传算法和经验误差最小化的支持向量机参数选择方法.在13个UC I数据集上的实验表明了本文算法的正确性与有效性,且具有良好的推广性能.  相似文献   

10.
为改善支持向量机的性能,从深度学习的角度研究核学习的方法,提出了基于多层感知器的深度核映射支持向量机模型( deep kernel mapping support vector machine,DKMSVM)以及相应的学习算法。该模型首先通过多层感知器学习一个从原始输入空间到合适维度空间的核映射代替传统意义上的核函数,然后直接在合适维度空间使用支持向量机进行分类,而不是采用核技巧进行求解。实验结果验证了DKMSVM的有效性。  相似文献   

11.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

12.
为满足超磁致伸缩材料精密加工异形孔的刚性、稳定性等要求,根据材料驱动特性对空间柔顺构件多个性能参数(驱动刚度、抗扭转刚度和一阶固有频率)进行优化设计,给出一种基于正交仿真试验和遗传算法的多目标优化方法.该方法通过主结构离散参数值的正交排列组合和有限元仿真获得两者的映射试验表,再采用回归拟合的方法建立各性能参数与主要结构参数的优化模型,经多目标遗传算法获得一组最优解,使柔顺构件弯曲变形量、扭转变形量、一阶固有频率分别为51.6um、3.3um、849.7 Hz,满足超磁致伸缩驱动特性和异形孔精密加工的要求.  相似文献   

13.
基于核化原理,提出核最优变换与聚类中心算法.算法通过非线性变换,将数据映射到核空间,并在核空间中执行最优变换与聚类中心算法.该算法可提取稳健的非线性鉴别特征,解决复杂分布数据的模式分类问题.同时,基于训练样本在核空间所张成的子空间的一组基,提出一个快速提取鉴别特征的计算方法,解决了一般核方法面临的“大训练集”难题.基于IRIS,YEAST,GLASS等数据的分类实验验证了该方法的有效性.  相似文献   

14.
Aimed at the lack of self-tuning PID parameters in conventional PID controllers, the structure and learning algorithm of an adaptive PID controller based on reinforcement learning were proposed. Actor-Critic learning was used to tune PID parameters in an adaptive way by taking advantage of the model-free and on-line learning properties of reinforcement learning effectively. In order to reduce the demand of storage space and to improve the learning efficiency, a single RBF neural network was used to approximate the policy function of Actor and the value function of Critic simultaneously. The inputs of RBF network are the system error, as well as the first and the second-order differences of error. The Actor can realize the mapping from the system state to PID parameters, while the Critic evaluates the outputs of the Actor and produces TD error. Based on TD error performance index and gradient descent method, the updating rules of RBF kernel function and network weights were given. Simulation results show that the proposed controller is efficient for complex nonlinear systems and it is perfectly adaptable and strongly robust, which is better than that of a conventional PID controller.  相似文献   

15.
传统的核化ISOMAP(K—ISOMAP)算法对于多个分散类簇数据集的低维映射不能较好地表现数据集的内在拓扑结构。针对此缺点,本文将对基于ISOMAP的多类多流形算法(MCMM-ISOMAP)进行核化,提出核化的多类多流形ISOMAP算法(K—MCMM-1SOMAP),该算法不仅使得多类数据集在降维后保持较好的内在拓扑结构,而且具备了K—ISOMAP算法的泛化能力,可以将测试数据直接映射到低维空间。因此,该算法可以在多类图像数据集中实现图像检索的功能。实验结果表明该算法与K—ISOMAP相比更具有效性。  相似文献   

16.
为了解决传统高斯混合模型GMM(Gaussian m ixture model)的训练方法对模型初值十分敏感、在实际训练中极易得到局部最优模型参数的问题,提出了一种GMM模型参数训练的新方法。将遗传算法与基于模糊聚类分析的GMM参数估计相结合,形成一种新的混合算法,对模型参数进行全局优化,提高了参数估计的准确性。采用自适应交叉和变异算子,同时利用模糊最小目标函数FMOF(FuzzyM inimum Objection Function)准则对模型参数进行重估,提高了算法的搜索效率,加快了算法的收敛速度。使用PKU-SRSC语音数据库进行了与文本无关的说话人辨认实验。实验表明,与传统的GMM训练方法和最大似然估计方法相比,本文方法可以得到更优的模型参数,同时识别率也有所提高。  相似文献   

17.
为改善传统的反向传播(BP)神经网络和径向基函数(RBF)神经网络的学习能力和分类性能的不足,提出一种融合RBF网络与BP网络的混合神经网络算法(HRBF -BP),并将其应用到医学数据分类问题中.在网络结构的实现上,将RBF隐藏层与BP隐藏层进行级联融合,即在连接BP网络输入层与隐藏层之间加入RBF核映射层; 在学习算法的实现上,先采用k-均值聚类算法来实现RBF核参数的估计,然后再使用基于随机梯度下降的BP算法实现级联BP网络的权值优化.将该算法与SGBP、KMRB、PFRBF等算法在不同的医学数据集上进行分类实验对比表明,该方法的网络训练精度以及测试精度均优于SGBP、KMRB、PFRBF算法; 因此,该方法对提高BP网络和RBF网络的学习能力和分类性能具有良好的参考价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号