共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
语音识别的一大难题就是参数提取和最佳结果的匹配搜索。本文利用离散小波变换(DWT)特有的奇异特征提取和时变滤波功能,结合动态时间规整算法(DTW)提出了分频匹配策略,实现了在频率域上“由粗及细”地匹配,使语音词汇的识别做到更准确、更快速。实验证明了该方法的正确性和可行性。 相似文献
3.
4.
提高说话人模型的识别性能一直是语音识别领域的一个重要课题。因子分析高斯混合模型(FAGMM)是因子分析方法与高斯混合模型(GMM)结合而成的多维概率统计模型,能更好地表征语音特征矢量的相关性,然而模型参数过多导致不能实现很好的分类。把改进的最小分类错误(MMCE)算法应用于该模型,形成一种新的FAGMM+MMCE模型,能解决前述问题,而且克服了传统的最小分类错误(MCE)算法在系统训练时不灵活、训练速度慢的缺点。实验结果表明,在30个说话人的识别应用中,本模型的识别率随着高斯混合数的增加而提高,较传统的MCE算法,识别率平均提高了3%,训练时间也平均节省了20%,说明该方法是有效的。 相似文献
5.
基于隐马尔可夫模型的话者识别研究 总被引:1,自引:0,他引:1
介绍了隐马尔可夫模型的有关理论、算法及其在说话人识别中的应用,并以线性预测倒谱LPCC及其差分形式作为特征参量,采用自左向右HMM进行建模和识别,实验证明该方法具有较好的识别性能,对于智能住宅信息安防领域中的主人身份辨识具有一定的应用价值。 相似文献
6.
7.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。 相似文献
8.
语言模型是语音识别系统的重要组成部分,目前的主流是n-gram模型。然而n-gram模型存在一些不足,对语句中长距信息描述差、数据稀疏是影响模型性能的两个重要因素。针对不足,研究者提出循环神经网络(Recurrent Neural Network,RNN)建模技术,在英语语言模型建模上取得了较好的效果。根据汉语特点将RNN建模方法应用于汉语语言建模,并结合两种模型的优点,提出了模型融合构建方法。实验结果表明:相比传统的n-gram语言模型,采用RNN训练的汉语语言模型困惑度(Per PLexity,PPL)有了下降,在对汉语电话信道的语音识别上,系统错误率也有下降,将两种语言模型融合后,系统识别错误率更低。 相似文献
9.
根据不同环境下不同说话人语音特征各阶差异较大的特点,对矢量量化算法进行改进,提出一种基于动态权值改进的矢量量化(VQ)方法。实验结果证明,该方法提高说话人识别系统的识别率。 相似文献
10.
本文分析了提取履带车辆目标声学特征存在的困难,提出将LPC方法应用于履带车辆目标的声识别。对LPC以及由它衍生出的PAR和CEP的识别有效性作了评价。结果表明三种系数均有效,其中以PAR的效果最好,将三种系数以线性加权的形式组合起来,其识别效果好于任何一种单一系数。试验结果表明LPC方法的识别错误率在15%以下,效果良好。 相似文献