共查询到20条相似文献,搜索用时 250 毫秒
1.
2.
3.
针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为每个子空间分别建立一个子系统,以各个子系统输出评分的线性加权作为系统的输出评分。分类后的模型可以采用较低的混合度,线性加权增强了贡献较大子空间对确认性能的作用。在NIST’03语音库上100个男性话者的实验表明,短语音条件下,分类系统的性能比不分类系统有显著的改进,运算效率较后者也提高很多。 相似文献
4.
给出了一种基于广义线性区分核支持向量机方法的VolP说话人确认算法,给出了直接从G.729,G.723.1(6.3Kb/s)和G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,采用广义线性区分核的支持向量机进行确认的方法。实验结果表明,该方法可有效地进行VoIP说话人确认。 相似文献
5.
探讨了HMM(隐马尔可夫模型)在说话人识别领域中的应用,并对说话人确认系统中的关键问题-确认阈值的确定,提出了一种新的解决方法。实验结果表明,该方法较好地解决了不同说话人的确认阈值的确定问题。 相似文献
6.
7.
为准确估计退役动力锂电池的荷电状态(SOC),避免其在储能系统中因放电容量不一致导致运行效果不佳,保障储能系统安全运行,提出了利用扩展卡尔曼粒子滤波算法(EKF-PF)与二阶Thevenin等效电路模型相结合的方法估计退役动力锂电池的荷电状态。该方法首先采用二阶Thevenin等效电路构建退役动力锂电池的等效电路模型,写出观测方程与状态方程;其次利用含遗忘因子的递推最小二乘法(FFRLS)对建立的等效电路模型进行参数辨识;最终通过EKF-PF算法在城市道路循环(UDDS)工况下对退役动力锂电池进行在线SOC估计,并与粒子滤波(PF)算法做对比。实验结果表明,EKFPF算法在估计退役动力电池SOC时能将其平均误差控制在1.23%以内,最大误差控制在3.37%以内,优于PF算法的估计结果。证明了EKF-PF算法在估计退役动力锂电池SOC时具有更高的精度和应用价值。 相似文献
8.
DSP嵌入式说话人识别系统的设计与实现 总被引:1,自引:1,他引:0
介绍一种基于浮点型数字信号处理器(TMS320C6713),并通过语音识别说话人身份的实用系统。为构建一个稳定实用的基于DSP说话人识别系统。以Mel倒谱系数作为特征参数,采用高斯混合模型作为识别模型,模型参数采用FLASH ROM存储,并实现自举运行。经过调试,实现了系统的自举运行,自举运行时可选择系统的训练和识别功能,并可方便地选择参加训练和识别的说话人,识别的范围为10人,识别的速度在3 s之内,准确率达98%以上。达到了系统设计的目的要求。与其他系统相比,该系统在实现算法上加以一定的改进,保证了识别率,并实现自举运行同时充分考虑可操作性,具有更大的实用价值。 相似文献
9.
10.
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话人选择过程,并采用最大后验概率(Maximum a Posteriori,MAP)代替最大似然(Maximum Likelihood,ML)准则进行支撑说话人权重的估算,最后对测试说话人进行线性组合。与现有的相关自适应方法相比,该算法能够有效提高自适应数据较少时的性能。实验结果表明,在仅有一句自适应语句的情况下系统汉字正识率从原有非特定人(Speaker Independent,SI)系统的45.67%到58.05%,相对原有说话人支持权重算法提高4.67%。 相似文献
11.
本文提出了一种新的说话人特征分类方法,基于计算动词相似度理论,建立距离和趋势的评价模型,通过计算特征向量与k-means算法聚类所得的聚类中心的相似度矩阵,将说话人个性特征从MFCC特征域映射到说话人相似度属性空间中,形成新的特征向量集,这样,每个说话人的特征向量将被聚为在距离和变化趋势上最具相似性的k分类。之后,利用GMM模型在属性空间内进行联合概率分析、匹配,建立新的说话人识别系统。本文采用标准TIMIT语音库与NIST语音库在该识别系统中进行一系列实验,结果表明,该基于新的优化特征分类的识别系统,对比传统的说话人识别系统,在等错误率上有很好的提高。 相似文献
12.
13.
噪声鲁棒性是影响话者确认系统实用化的关键问题之一,为了提高系统的噪声鲁棒性,本文设计了基于子带隐Markov模型(HMM)和多层感知机(MLP)的话者确认系统,系统由多个子带系统所构成,对每个子带分别建立基于背景模型的连续HMM话者确认模型,采用MLP对各个子带HMM的输出进行非线性拟合,并利用MLP直接做确认判决,在与文本有关的话者确认实验中,本文提出的模型较常规基于背景模型的HMM话者模型在确认性能和噪声鲁棒性上均有所提高,实验进一步表明,利用MLP进行拟合和判决在一定程度上解决了话者确认阈值设置的困难,有效地提高了确认系统的鲁棒性。 相似文献
14.
15.
16.
针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。 相似文献
17.
受到模型规模大和计算量大的限制,经典的基于高斯混合模型的说话人识别方法不适合于资源有限的PDA平台实时说话人自动识别要求。以Mel倒谱系数为说话人特征,运用主成分分类技术,结合定点数计算技术实现实时说话人自动识别。在19个用户的语音库上进行系统识别实验,此新型分类技术的训练时间缩短为基线系统的1/50,测试时间缩短为1/12,模型规模缩小为1/6,同时识别性能达到94.7%。 相似文献
18.
基于支持向量机的说话人辨认研究 总被引:10,自引:0,他引:10
支持向量机是统计学理论的一个重要的学习方法,也是解决模式识别问题的一个有力的工具,本文提出了用支持向量机来解决说话人辨认问题。结合语音信号的特点,解决了大数据量情况下支持向量机的训练问题。支持向量机对两类的分类问题有着突出的优势,本文用两种判决规则将两类问题应用到多类的识别问题。用支持向量机实现了一个与文本无关的说话人辨认系统,实验表明,本方法有良好的效果。 相似文献
19.