首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种基于模型距离的改进的说话人识别技术   总被引:1,自引:0,他引:1  
提出了一种测量高斯混合模型距离的方法。基于此方法提出一种改进的说话人识别系统:首先从语音中提取几种参数;再分别训练高斯混合模型;然后选择使说话人辨认系统模型平均距离较大的那种特征参数的高斯混合模型,作为该说话人的训练模型;最后在识别时提取此种特征参数进行识别。本文仿真了两种不同模型平均距离的特征参数的正确识别率。实验结果表明:对说话人辨认系统来说,采用使模型平均距离较大的特征参数,所对应的识别性能较好。  相似文献   

2.
针对在说话人识别过程中经典的高斯混合模型(Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法(AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法(MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法(AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.  相似文献   

3.
为更系统地讨论说话人辨认系统中UBM(universal background model)训练时长对系统识别性能的影响,针对UBM训练时长和混合度设置了一组实验,在基于GMM-UBM(gaussian mixture model-universal background model)的说话人辨认系统中,探讨了UBM训练时长和混合度之间的关系,得出了UBM平均每个混合得到100帧左右训练样本时,能够获得较高且较稳定识别率的结论,并总结出了在某一混合度下UBM训练数据净时长的范围,为以后的研究提供了一个基本的数据依据。  相似文献   

4.
现有说话人识别算法普遍受信道因素的干扰,为了提高算法的准确率,在特征级利用特征弯折算法对语音特征参数进行处理,在模型级利用因子分析技术对说话人混合高斯模型(GMM)进行信道处理。对端点进行检测后,利用特征弯折算法对语音特征参数梅尔倒谱系数(MFCC)进行处理,去除线性信道和背景噪声的影响,并建立说话人GMM。然后利用因子分析技术拟合说话人特征空间与信道空间的差异,去除信道因子的影响。最后提取高斯超向量并通过支持向量机(SVM)得到识别结果。实验结果证明了信道补偿算法与GMM-SVM相结合能获得更好的识别率,并能保证算法的鲁棒性。  相似文献   

5.
随着当前电子商务和金融交易领域的发展,用户身份认证的应用变得越来越广泛。结合实际,本文构建了一种基于人脸和语音的混合型身份认证系统,分别提出了基于重建误差分类器的特征脸确认算法和基于高斯混合(Gaussian mixture models,GMM)说话人确认算法;最后在分数层进行融合,提出了基于正交多项式核函数的支持向量机。实验结果表明,该方法在分类、泛化能力和减少支持向量数目方面均取得了良好的效果,最终获得了较小的等误差率。  相似文献   

6.
随着当前电子商务和金融交易领域的发展,用户身份认证的应用变得越来越广泛.结合实际,本文构建了一种基于人脸和语音的混合型身份认证系统,分别提出了基于重建误差分类器的特征脸确认算法和基于高斯混合 (Gaussian mixture models, GMM)说话人确认算法;最后在分数层进行融合,提出了基于正交多项式核函数的支持向量机.实验结果表明,该方法在分类、泛化能力和减少支持向量数目方面均取得了良好的效果,最终获得了较小的等误差率.  相似文献   

7.
一种改进的高斯混合模型算法   总被引:4,自引:0,他引:4       下载免费PDF全文
建立声学模型是说话人识别技术的重要环节,一种好的建模方法对说话人识别系统的识别率具有极其重大的影响。本文介绍了一种改进的高斯混合模型算法——将聚类算法与传统高斯混合模型结合起来的建模方法,并对此种建模方法得出的识别效果与传统的高斯混合模型进行了比较。从对比结果可以看出,基于聚类的高斯混合模型的说话人识别相对于传统的高斯混合模型在识别率上有所提高。  相似文献   

8.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数元,使似然概率最大。通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降.采用能覆盖话者语音的高斯混合模型-通用背景模型(GMM—UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

9.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

10.
根据语音学的研究,提出中性时发音相似的说话人,在情感状态下的发音人相似的假设--邻居相似现象,并通过定量和定性的分析验证了该假设,即在音素内容相同的情况下,同一说话人的中性模型和情感模型对应高斯分量的“邻居”基本类似.为了解决说话人情感变化时语音短时特征的分布与中性语音模型存在差异的问题,提出说话人情感模型合成的方法--将开发库中学习到的中性 情感变化规律移植到评测库中,根据说话人的中性模型合成出情感模型.从邻居相似现象的特性出发,根据KL距离选取该说话人中性下若干相似的邻居,根据基于邻居的方法和基于邻居变换的方法,合成出该说话人的情感模型.MASC库上的实验结果表明,该方法的识别准确率比传统的GMM-UBM算法提高了2.81%,与情感属性映射(EAP)方法相比识别率提高了1.3%.  相似文献   

11.
介绍了采用连续M元高斯混合密度的隐式马尔柯夫模型的语音识别实验系统,对语音特征矢量用非线性归一化算法进行预处理。另一,还提出一种基于语音识别的模型初始化方法。实验证明:语音的预处理和模型初始化方法都取得了较明显的效果。  相似文献   

12.
运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。  相似文献   

13.
介绍了采用连续M元高斯混合密度的隐式马尔柯夫模型的语音识别实验系统,对语音特征矢量用非线性归一化算法进行预处理.另外,还提出一种基于语音知识的模型初始化方法.实验证明:语音的预处理和模型初始化方法都取得了较明显的效果.  相似文献   

14.
为了解决传统高斯混合模型GMM(Gaussian m ixture model)的训练方法对模型初值十分敏感、在实际训练中极易得到局部最优模型参数的问题,提出了一种GMM模型参数训练的新方法。将遗传算法与基于模糊聚类分析的GMM参数估计相结合,形成一种新的混合算法,对模型参数进行全局优化,提高了参数估计的准确性。采用自适应交叉和变异算子,同时利用模糊最小目标函数FMOF(FuzzyM inimum Objection Function)准则对模型参数进行重估,提高了算法的搜索效率,加快了算法的收敛速度。使用PKU-SRSC语音数据库进行了与文本无关的说话人辨认实验。实验表明,与传统的GMM训练方法和最大似然估计方法相比,本文方法可以得到更优的模型参数,同时识别率也有所提高。  相似文献   

15.
针对候选区域提取准确度问题及火焰特征的描述能力,提出一种基于高斯混合模型(Gaussian mixture model, GMM)与三维的局部二值模式(local binary pattern, LBP)纹理特征的火焰检测算法,分析火焰在RGB与HSV两个空间中的分布规律,训练出火焰的高斯混合模型,提取火焰候选区域。重点研究火焰的纹理特征,将LBP纹理与火焰的运动特征相结合形成一种新的三维LBP纹理,提高纹理特征对火焰的分类效果。使用单分类支持向量机(one-class support vector machine, One-class SVM)分类方法,判定候选区域是否为火焰。  相似文献   

16.
提出了一种基于子带处理多分类器融合的说话人识别方法 .宽带语音信号通过Mel滤波器组转变为多个子带信号 ,对各子带数据独立分析提取相应的特征参数 ,进而对每个子带分别建立识别模型进行判决 ,最后利用分类器融合规则 ,给出总体判决 .研究表明 ,该方法在子带数目选为 16时可以得到最好的识别效果 ,并且在有窄带噪声的情况下 ,子带多分类器融合法比宽带语音数据建模表现出更好的鲁棒性 .  相似文献   

17.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

18.
运用高维空间几何学和流形学习理论, 讨论了仿生模式识别的原理, 给出了具体算法设计和 基于高维空间几何的实现方法.在不限定流形维数的情况下, 对学习样本覆盖方法和测试样本识别 方法进行了具体实现, 为仿生模式识别的应用和推广奠定了基础.通过设计的说话人无关语音识别 的试验, 验证了方法的可行性, 并取得了比传统识别方法更高的识别效果.  相似文献   

19.
提出了一种基于子带处理多分类器融合的说话人识别方法.宽带语音信号通过Mel滤波器组转变为多个子带信号,对各子带数据独立分析提取相应的特征参数,进而对每个子带分别建立识别模型进行判决,最后利用分类器融合规则,给出总体判决.研究表明,该方法在子带数目选为16时可以得到最好的识别效果,并且在有窄带噪声的情况下,子带多分类器融合法比宽带语音数据建模表现出更好的鲁棒性.  相似文献   

20.
相关向量机及在说话人识别应用中的研究   总被引:2,自引:0,他引:2  
对基于相关向量机和高斯混合模型的说话人识别算法的模型和特征空间进行了一系列的研究。与一些基于语音帧的说话人识别算法相比,该算法将GMM算法作为底层的语音特征提取,从而实现对语音整体上的处理,对常用的两种语音特征美尔频率倒频系数和瞬时频率的表现进行了对比研究;同时,该算法充分利用了相关向量机的所提供的高泛化性、核函数功能和结果的高稀疏性。基于Chains和AHUMADA两个专门用于说话人识别的语音库的仿真表明,该算法在减少相对误差和减少计算量方面有较大的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号