首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
提高说话人模型的识别性能一直是语音识别领域的一个重要课题。因子分析高斯混合模型(FAGMM)是因子分析方法与高斯混合模型(GMM)结合而成的多维概率统计模型,能更好地表征语音特征矢量的相关性,然而模型参数过多导致不能实现很好的分类。把改进的最小分类错误(MMCE)算法应用于该模型,形成一种新的FAGMM+MMCE模型,能解决前述问题,而且克服了传统的最小分类错误(MCE)算法在系统训练时不灵活、训练速度慢的缺点。实验结果表明,在30个说话人的识别应用中,本模型的识别率随着高斯混合数的增加而提高,较传统的MCE算法,识别率平均提高了3%,训练时间也平均节省了20%,说明该方法是有效的。  相似文献   

2.
武光利 《硅谷》2012,(19):179+189-179,189
说话人识别是语音识别的一个重要的分支,是当前的研究热点之一。首先介绍说话人识别的基本原理,然后介绍说话人识别常用的特征参数和分类方法,最后探讨说话人识别研究的难点。  相似文献   

3.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。  相似文献   

4.
罗春梅  张风雷 《声学技术》2021,40(4):503-507
为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信息,然后采用改进的深度卷积神经网络进一步对准帧间信息,以提高说话人识别特征对背景噪声的适应性。实验结果表明,相比于高斯混合模型-通用背景模型等识别框架及传统MFCC等特征,该算法可取得更高的识别准确率和最小的识别均方误差。  相似文献   

5.
语音识别技术飞速发展,在现实生活中扮演着越来越重要的角色,语音识别简单来说就是让计算机理解人的语音,它有两大研究领域:语种识别和说话人识别。说话人识别是指计算机能够识别出语音来自那个说话人,在身份验证等众多领域有很广泛的应用。本文着重探究哪种细微声音对说话人识别的效果好,这些细微声音有"嗯""啧啧""清嗓子""清鼻子"等,最后进行人机大战,得出机器的准确率普遍比较高的结论。  相似文献   

6.
刘大力  赵力 《声学技术》2004,23(Z2):105-106
1前言 用语音来鉴别说话人身份有许多独特的优点,如语音是人的固有特征,不会丢失或遗忘;语音信号采集方便,系统设备成本低等,因此自动说话人识别具有广泛的应用前景[1].本文以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,比较了利用矢量量化(VQ)[2]、各态经历隐马尔可夫模型(HMM)[3]、混合高斯分布模型(GMM)[4]技术实现的与文本无关说话人识别系统的性能.结论是GMM性能最好,最高识别率可达93.6%,其次是各态经历HMM,而VQ最差,其最高识别率仅为86.2%.  相似文献   

7.
姚明秋  徐韩  王芳 《硅谷》2011,(21):177-178
分类在说话人识别中的应用对于提高系统响应时间有非常重要的作用,对基频和共振峰进行研究,基频可以用于区分男声和女声,依据共振峰的幅值则可以区分成人和儿童,将这种分类方法应用于说话人识别中可以大大缩短识别时间。  相似文献   

8.
基于手背静脉虹膜和指纹融合身份识别算法   总被引:1,自引:0,他引:1  
针对单模态生物特征识别的局限性,提出融合手背静脉、虹膜和指纹三种生物特征实现身份识别.首先分别对手背静脉图像、虹膜图像和指纹图像进行独立的图像预处理,特征提取和特征匹配,输出各自的匹配分数.分析匹配分数归一化对识别性能的影响,采用Tarh归一化方法对三种生物特征的匹配分数进行归一化处理,最后利用加权求和法则实现匹配分数的融合,利用最小距离分类器实现身份识别.实验结果表明,融合识别算法的等错率为0.009%,当错误接受率接近0时,对应的错误拒绝率仅为0.2%.  相似文献   

9.
基于启发式错误驱动学习的中文时间表达式识别   总被引:1,自引:0,他引:1  
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法.该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%.最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%.  相似文献   

10.
陈晓  曾昭优 《声学技术》2024,43(1):119-126
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号