首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
汽车声音识别是汽车声源定位等研究的基础,对交通事故鉴定、犯罪举证和犯罪现场还原等具有重要意义。现有汽车声音识别算法存在算法复杂度高和识别率相对较低等问题。针对现行问题,将以梅尔倒谱系数( MFCC)特征与自相关函数(ACF)方差作为混合特征的汽车声音识别算法应用到汽车声音识别系统中。该算法使用高斯混合模型(GMM)进行汽车声音建模和识别,获得比MFCC特征及其一阶差分特征组成的混合特征更好的识别效果。并通过仿真实验证明了该算法的有效性。  相似文献   

2.
介绍了基于咳嗽音信号的身份识别方法.针对咳嗽音信号的短时突发特点,提出了一种适合咳嗽音的改进MFCC 特征参数MFCC_N,然后将MFCC_N与短时能量(E)作为组合特征参数应用于身份识别系统中.在MATLAB 7.0平台上实现基于GMM的咳嗽音身份识别系统,分别提取咳嗽音信号的MFCC、MFCC+△MFCC和MFCC_N+E作为识别参数进行对比实验.实验结果表明,采用提出的组合特征参数MFCC_N+E进行身份识别是可行有效的,与传统参数MFCC、MFCC+△MFCC相比,采用特征参数MFCC_N+E的识别系统具有较高的识别率和较低的计算复杂度.  相似文献   

3.
基于MFCC和双重GMM的鸟类识别方法   总被引:1,自引:0,他引:1  
针对鸟类鸣声信号变化丰富和复杂的特点,提出一种基于MFCC和鸣叫、鸣唱声GMM模型的鸟类识别方法。该方法拟采用将鸟鸣声分为鸟叫声和鸟唱声的策略,分别提取其特征参数MFCC,提出双重GMM模型进行训练和识别。用8种鸟的鸣叫声和鸣唱声1077个样本进行实验,实验结果表明,双重GMM模型的识别率达到90%以上,与单一鸣声模型相比具有更高的识别率。  相似文献   

4.
张少华  秦会斌 《测控技术》2019,38(11):86-89
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。  相似文献   

5.
提出了一种基于高斯混合模型(GMM)的自然环境声音的识别方法。提取Mel频率倒谱系数(MFCCs)来分析声音信号;对于每种声音使用期望最大化算法基于MFCC特征集建立高斯混合模型;使用最小错误率判决规则和投票裁决的方法进行识别。使用GMM对36种自然环境的声音进行识别的正确率可达95.83%,且识别效果优于K最近邻(KNN)。  相似文献   

6.
基于动态MFCC的说话人识别算法   总被引:1,自引:0,他引:1  
提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果.  相似文献   

7.
鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高.  相似文献   

8.
针对采用梅尔倒谱系数(MFCC)表征异常声音时识别率低下问题,提出获取MFCC的改进方法,包括对公共场所典型异常声音信号的特性分析和MFCC提取过程中滤波器组的重新设计。基于公共场所异常声音数据库的实验结果表明,与MFCC特征提取方法相比,该方法提高了特征参数在识别系统中的效率,具有一定的优越性和实用性。  相似文献   

9.
杨磊  赵红东 《计算机应用》2020,40(11):3172-3177
针对传统卷积神经网络(CNN)模型存在大量冗余参数的问题,提出了两个基于SqueezeNet核心结构Fire模块的轻量级网络模型Fnet1和Fnet2。之后结合移动端分布式数据采集和处理的特点,在Fnet2模型基础上,依据Dempster-Shafer(D-S)证据理论将Fnet2与深度神经网络(DNN)融合,提出新的网络模型FnetDNN。首先,建立一个具有四层卷积层的神经网络Cent作为基准,以梅尔倒谱系数(MFCC)作为特征输入来对比分析Fnet1、Fnet2和Cent的网络结构特点、计算量、卷积核参数数量及识别准确率,结论是Fnet1仅使用Cnet参数数量的10.3%就可达到86.7%的分类准确率;然后,将MFCC与全局特征向量输入到FnetDNN模型中,使得该模型的识别准确率提高到了94.4%。实验结果表明,Fnet网络模型不仅可以压缩冗余参数,还可以与其他网络相融合,具备模型扩展能力。  相似文献   

10.
改进的混合MFCC语音识别算法研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。  相似文献   

11.
胡峰松  张璇 《计算机应用》2012,32(9):2542-2544
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。  相似文献   

12.
利用高斯混合模型(GMM)方法进行语音的性别识别.首先概述了特征提取、识别方法及性别识别的过程;然后通过减少提取特征的语音帧数和降低高斯混合模型的混合阶数来提高性别识别速度;最后,将由Mel频率倒谱参数(MFCC)特征和基音频率特征两种方法得到的测试样本后验概率结合,提出新的计算测试样本后验概率的方法.实验表明依据此后验概率能有效提高识别的正确率.  相似文献   

13.
GMM文本无关的说话人识别系统研究   总被引:3,自引:2,他引:1       下载免费PDF全文
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。  相似文献   

14.
通过分析嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,提出了基于多尺度分析的小波降噪、分解的熵系数(Entropy Coefficient based on De-noise,Decomposition of Multi-scale Analysis,ECDDMA)作为识别的特征矢量集。并对比分析了语音识别中经典特征参数Mel倒谱系数(MFCC),分别运用这两种特征参数对242例正常嗓音和234例病态嗓音运用高斯混合模型(GMM)进行了识别。结果显示:ECDDMA系数较传统的模拟人耳听觉非线性特性的MFCC及其动态特征能更准确地表征正常与病态嗓音之间的差异,有利于同时提高病态和正常嗓音的识别率。  相似文献   

15.
提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。  相似文献   

16.
一种基于MFCC和LPCC的文本相关说话人识别方法   总被引:1,自引:0,他引:1  
于明  袁玉倩  董浩  王哲 《计算机应用》2006,26(4):883-885
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。  相似文献   

17.
为了对现场机械或设备进行监控、诊断和识别,以音频为监控手段,引入矢量量化(VQ)算法并建立机械设备音频的离散隐Markov模型(DHMM)。特征参数采用MFCC,码书设计采用Linde-Buzo-Gray(LBG)算法;推导出Baum-Welch算法参数重估的多观察序列的最简标定形式;分析了多种HMM类型,提出了适合机械设备音频的HMM。实验在22种音频中进行,识别准确率在97%以上,证明了方法的有效性。  相似文献   

18.
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。  相似文献   

19.
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号