首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
一种改进的高斯混合模型算法   总被引:4,自引:0,他引:4       下载免费PDF全文
建立声学模型是说话人识别技术的重要环节,一种好的建模方法对说话人识别系统的识别率具有极其重大的影响。本文介绍了一种改进的高斯混合模型算法——将聚类算法与传统高斯混合模型结合起来的建模方法,并对此种建模方法得出的识别效果与传统的高斯混合模型进行了比较。从对比结果可以看出,基于聚类的高斯混合模型的说话人识别相对于传统的高斯混合模型在识别率上有所提高。  相似文献   

2.
在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明:有效地提高了说话人辨认系统的识别率.  相似文献   

3.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

4.
针对说话人训练和识别时间长、噪音环境下识别率低的问题,提出一种CFCC-PCA特征参数的说话人辨识方法。首先提取具有听觉特性的CFCC特征参数,然后对其进行PCA变换,找出具有分辨能力的参数,最后再用这些参数在云服务器中训练和识别说话人。实验表明:该方法可以提高说话人辨识的鲁棒性和识别率,云服务可提高系统实时性。  相似文献   

5.
一种基于混合神经网络的说话人识别系统   总被引:1,自引:1,他引:0  
目前说话人识别系统的识别率已经达到较高的水平,但是在应用系统的整合方面还存在一定的问题,比如其算法的复杂度高,不易于低成本的硬件实现等都限制其达到普及化.针对这样的问题,提出一种高性能、结构简单的基于自组织映射(SOFMNN)和概率神经网络(PNN)的混合神经网络分类器以取代目前常用的高斯混合模型(GMM)分类器.实验结果表明,混合神经网络分类器在识别率、识别速度和存储量上都优于高斯混合模型分类器.混合神经网络模型是一种高性能、高效率的说话人识别系统,该系统在说话人识别中将会有很好实用价值.  相似文献   

6.
通过建立一种新的混合模型——SVM-GMM模型,用以提高说话人辨认的识别率。其中介绍了高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,指出了高斯混合模型和支持向量机在实际应用中的不足之处,并针对这两种模型各自的特点,提出了将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量机(SVM)模型的概率输出,并建立了SVM-GMM混合模型。通过实验对比,验证了使用SVM-GMM模型能有效的提高系统识别率。  相似文献   

7.
在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法。目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据。而这一要求在现实应用中通常难以满足,导致其识别率急剧降低。针对这一问题,提出了一种基于稀疏编码的说话人识别方法。该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分。实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果。  相似文献   

8.
建立一种新的混合模型-SVM-GMM模型,用以提高说话人辨认的识别率。阐述高斯混合模型(GMM)和支持向量机(SVM)建立的基本原理,分别指出高斯混合模型和支持向量机在实际应用中的不足之处,并针对两种模型的特点,提出将GMM模型的输出机制引入到SVM模型中,以便于调整支持向量(SVM)模型的概率输出,并建立SVM-GMM混合模型。通过实验对比,验证使用SVM-GMM模型能有效地提高系统识别率。  相似文献   

9.
为了提高基于高斯混合模型-通用背景模型(GMM UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了459%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM UBM系统的运行效率.  相似文献   

10.
为更系统地讨论说话人辨认系统中UBM(universal background model)训练时长对系统识别性能的影响,针对UBM训练时长和混合度设置了一组实验,在基于GMM-UBM(gaussian mixture model-universal background model)的说话人辨认系统中,探讨了UBM训练时长和混合度之间的关系,得出了UBM平均每个混合得到100帧左右训练样本时,能够获得较高且较稳定识别率的结论,并总结出了在某一混合度下UBM训练数据净时长的范围,为以后的研究提供了一个基本的数据依据。  相似文献   

11.
The remaining useful life (RUL) prediction is a crucial indicator for the lithium-ion battery health prognostic. The particle filter (PF), used together with an empirical model, has become one of the most well-accepted techniques for RUL prediction. In this work, a novel filtering algorithm, named the Gaussian mixture model (GMM) - ensemble Kalman filter (EnKF) is proposed. It embeds the Gaussian mixture model in the EnKF framework to cope with the non-Gaussian feature of the system state space, and meanwhile address some of the major shortcomings of the PF. The GMM-EnKF and the PF are both applied on public data sets for RUL prediction and the simulation results show superiority of our proposed approach to the PF.  相似文献   

12.
针对三维模型检索系统提高准确率、减少几何特征和人类语义丰富性之间的“语义鸿沟”等问题, 提出一种基于高斯过程的语义分类和检索新方法.该方法采用一种统计2个采样点相对质心向量夹角的AC2直方图新特征,与形状分布的D2特征组合成低层特征,使用高斯过程进行三维模型语义分类的监督学习,计算测试模型的语义类概率预测分布,建立低层特征和查询概念之间的联系;使用语义距离和不相似度计算方法进行检索排序.实验结果表明:与已有的某些监督学习的方法相比,多类的测试模型进行语义分类的准确率明显得到提升,检索中能体现语义概念,检索性能也得到提高.  相似文献   

13.
基于正交高斯混合模型的说话人识别研究   总被引:5,自引:0,他引:5       下载免费PDF全文
本文介绍了正交高斯混合模型(OGMM)及其在说话人识别中的具体应用。传统的高斯混合模型(GMM)常常假定协方差矩阵为对角线矩阵,但需大量的混合成来表征分布情况,这将会导致训练量的增加。OGMM的主要思想是传统的GMM之前先将特征矢量变换到由协方差矩阵的本征向量决定的空间中去,这样得到的对角线协方差矩阵可以更准确地反映分布的情况。基于OGMM的说话人识别实验表明该算法在说话人识别方面比传统的GMM算法有更好的效果并具有良好的应用前景。  相似文献   

14.
针对全方位视觉传感器视野范围大的特点,提出一种基于自适应混合高斯模型的全方位视觉目标检测系统.该系统通过Hough变换检测全方位图像的中心,基于图像中心对全方位图像进行展开.对展开后的图像利用混合高斯模型进行背景建模,并自适应地更新背景模型,通过前景分割可以有效地分割出运动目标.在图像展开及混合高斯建模时,通过调整系统的采样频率可以较好地改善目标检测的实时性.实验结果表明,该系统可以在复杂环境中有效地检测运动目标,具有较强的准确性和鲁棒性.  相似文献   

15.
高斯混合模型(GMM)已广泛运用于文本无关的说话人识别系统中,该方法具有简单高效的特点。在使用EM算法训练GMM时,GMM模型的初始化参数必须首先确定。本文采用改进后的模糊C均值聚类(FCM)方法将特征矢量归为与混合数相等的各个类中,然后计算参数作为初始值。实验表明,此训练方法能够获得更优的模型参数且识别率有较大的提高。  相似文献   

16.
针对当前以人工智能为基础的墙体裂缝识别主要以图像识别为主,容易受到裂痕特征分布不均匀的影响,识别精度不高的问题,提出基于特征分布和高斯混合模型的建筑墙体裂缝图像识别方法.采用Harris角点检测算法对墙体图像进行角点求解处理,对建筑墙体图像进行预处理;通过选择掩模平滑法对墙体图像进行增强处理,将特征分布和高斯混合模型相结合,实现对建筑墙体裂缝图像的高精度识别.结果表明,该方法识别精度较高且识别时间短,预处理效果明显增强.  相似文献   

17.
背景减除法常采用混合高斯模型作为背景模型来进行目标检测,它可以自适应学习并表示分布复杂的背景.混合高斯模型在光线变化缓慢的情况下表现很好,但是在光线快速变化的情况下,由于高斯背景无快速更新机制,无法应对光线迅速变化的情况.通过对混合高斯模型进行优化,提出了一种改进的混合高斯模型检测算法,并通过实验证明了新算法明显提高了运动目标检测的准确度.  相似文献   

18.
行为模式挖掘技术是监控视频语义分析的重要组成,由于先验知识的缺乏与特征维数约束,难以准确定义参数化挖掘模型的结构复杂度,通过非参数化的无限高斯混合聚类运动特征得到原子行为模式,并估计其持续时间分布,使用局部特征维测试验证了挖掘模型的运动相似性假设。结果表明所得到的行为模式集准确刻画了场景的潜在运动语义,而通过行为中存在的时间多形态分布进一步发现了隐藏运动知识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号