共查询到19条相似文献,搜索用时 93 毫秒
1.
2.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。 相似文献
3.
高斯混合模型(GMM)已广泛地应用于文本无关的说话人识别系统,该方法具有简单高效的特点.但如果GMM模型的高斯混合分量的数目比较多时,整个模型运算的复杂度会比较大.针对这个问题,提出将聚类算法和传统的高斯混合建模结合起来从而优化高斯混合模型,能够有效地提高说话人识别的速度.实验结果验证了这种算法的高效性. 相似文献
4.
采用掌上电脑录音的语音数据库,研究与文本无关的说话人识别,通过引入一种基于高斯混合模型和假设检验方法的新算法,有效提高说话人确认系统的性能.实验结果表明,以假设检验分析为基础的识别算法比传统的使用假冒说话人背景集标准化法的识别算法更加有效,可以同时获得低错误拒绝率(FRR)和低错误接受率(FAR),是一种适合于用掌上电脑录音的语音数据的方法. 相似文献
5.
随着说话人模型数量的增加,说话人识别系统的识别速度下降,不能满足实时性要求。针对这个问题,提出了基于分层识别模型的快速说话人识别方法。将变分法求解的KL散度的近似值作为模型间的相似性度量准则,并设计了说话人模型聚类的方法。结果表明,本文方法能够保证说话人模型聚类结果的有效性,在系统识别率损失很小的情况下,使系统的识别速度得到大幅度提升。 相似文献
6.
7.
选择合适的聚类数和准确划分类间重叠的数据是聚类分析领域2个被广泛研究的问题.提出了一个基于高斯混合模型的层次聚类算法(HCGMM),该算法基于重叠度的衡量,而且不需要预先指定聚类数,能够很好地解决以上两个问题.算法根据高维空间中混合模型每2个组成成分之间的重叠情况自动运行或停止,从而准确划分类间重叠的数据,并自动确定聚类数.最后,通过标准的数据的测试,以及通过把它应用于不同类型的真实彩色图像分割表明,该算法是有效的,而且对噪声影响不敏感.把它和其他层次算法进行比较和分析,以证明该算法的优越性. 相似文献
8.
针对传统高斯混合模型在建模过程中只采用倒谱系数表示的语音谱特征,而忽略说话人基音频率信息的问题,提出了一种基于多空间概率分布的基音融合高斯混合模型。该模型在每个高斯成分空间中对浊音和清音进行选择性区分,并将基音与倒谱特征参数进行融合。实验结果表明,通过对模型参数进行重估计,在TIMIT、NTIMIT两种不同语料库情况下,该模型的识别率较两种不同的基线系统均有提高。 相似文献
9.
在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求。文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率。研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人。实验结果显示,文中方法可使辨识速度平均提高3。2倍,而闭集辨识错误率平均只有0。9%的增加。采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5。1%。 相似文献
10.
针对传统高斯混合模型在噪声环境下识别率明显下降的问题,在借鉴随机概率分布模型间的α因子融合机制基础上,提出基于可变因子α整合的高斯混合模型。该模型通过引入可变因子使得混合模型中不同成分所占的比重又得到一次调整。实验结果表明,通过对该模型参数进行重估计,在TIMIT/NTIMIT两种不同语料库和不同样本集的情况下识别率较传统高斯模型均有提高。尤其在噪声环境和α因子取最优值时,识别率可提高8%,在NIST评测数据集上与GMM-UBM系统对比,识别率也有提高。 相似文献
11.
12.
针对传统模糊聚类分割方法无法有效模拟数据分布特征的问题,提出基于邻域约束高斯混合模型的模糊聚类图像分割算法.利用高斯分布刻画聚类内像素光谱测度统计特征,定义像素与其邻域像素相关性的先验概率,并作为高斯混合模型中各高斯分量权重系数,构建包含特征场邻域作用的高斯混合模型.利用高斯分量描述像素与聚类间的非相似性测度,建立基于高斯混合模型的模糊聚类目标函数.在传统模糊聚类方法基础上,采用高斯混合模型定义像素与聚类间的非相似性测度,并在高斯混合模型中融入邻域作用,有效解决数据具有多峰值特征的问题.最后通过实验验证文中算法的准确性. 相似文献
13.
针对云南境内白族、纳西族、傈僳族3个典型的少数民族及汉族普通话语音,采用了高斯混合模型来训练每个民族的口音模型,并用少量的测试语音来获得较为满意的口音分类识别率,目的在于探索降低非母语口音话者语音识别错误率的有效途径.该文通过实验给出,对云南民族口音汉语普通话口音识别,当混合数为16,语音特征采用39维MFCC及其一阶、二阶差分参数时,口音识别正确率可达90.83%. 相似文献
14.
15.
在运动目标检测过程中,背景建模对目标提取至关重要,而混合高斯模型是目前背景建模中较流行的方法之一。针对混合高斯模型中存在的不足做了两点改进:(1)混合高斯模型是对各点孤立建模,对于拥有较高的分辨率的图像运算量较大,引入分块建模思想,可以明显提高目标检测的速率而且考虑到像素点之间的空域信息;(2)混合高斯模型对运动目标停留在场景中某一位置停留过长时,会出现将前景转化成背景,以致于产生目标在场景中消失的现象,根据目标在场景中运动与静止的情况,决定是整帧更新还是只更新背景区域。通过实验可以得出,该算法在不影响识别的情况下可以显著地提高运动目标的检测速率,而且可以减少部分噪声,另外也能有效地克服目标转化为背景的情况,从而保持了运动目标出现的连续性。 相似文献
16.
为了解决传统高斯混合模型(GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,提出了一种采用微粒群算法优化GMM参数的新方法。该方法将最大似然估计融入到微粒群算法迭代过程中,形成了新的混合算法。它利用微粒群算法的全局优化性及最大似然估计的局部寻优性求解高斯混合模型的参数,以提高参数精度。说话人辨认实验表明,与传统的方法相比,新方法可以得到更优的模型参数,使得系统的识别率进一步提高。 相似文献
17.
文章针对统一背景模型与群模型两种反模型进行了分析,在基于统一背景模型与群模型的改进说话人确认模型的基础上,将贝叶斯自适应算法引入到基于高斯混合统一背景模型的说话人确认系统,解决了说话人确认中存在的模型不匹配问题,通过文本无关的测试语音库进行的实验和分析显示,改进算法具有更好的识别效果。 相似文献
18.
针对高斯混合模型(GMM)聚类算法对初始值敏感且容易陷入局部极小值的问题,利用密度峰值(DP)算法全局搜索能力强的优势,对GMM算法的初始聚类中心进行优化,提出了一种融合DP的GMM聚类算法(DP-GMMC)。首先,基于DP算法寻找聚类中心,得到混合模型的初始参数;其次,采用最大期望(EM)算法迭代估计混合模型的参数;最后,根据贝叶斯后验概率准则实现数据点的聚类。在Iris数据集下,DP-GMMC聚类准确率可达到96.67%,与传统GMM算法相比提高了33.6个百分点,解决了对初始聚类中心依赖的问题。实验结果表明,DP-GMMC对低维数据集有较好的聚类效果。 相似文献
19.
针对语音信号的非结构化特点,提出了一种基于量子隧穿效应的说话人真伪鉴别方法。以量子隧穿效应为理论依据,首先,在分析语音信号分帧的量子特性基础上,将每一帧语音信号看作一个量子态,实现算法的量子化;然后,利用势垒能分离能量的特性,通过构建势垒组以提取信号的能量谱特征,并以此作为特征参数;最后,通过高斯混合模型(GMM)进行语音信号建模,完成说话人的真伪鉴别。仿真结果表明,相对于传统方法,利用量子隧穿效应理论实现说话人鉴别可以有效降低算法的复杂度,提高识别的识别率和可靠性,为量子信息理论和说话人真伪鉴别方法提供了新的研究途径。 相似文献