共查询到20条相似文献,搜索用时 0 毫秒
1.
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。 相似文献
2.
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。 相似文献
3.
汽车声音识别是汽车声源定位等研究的基础,对交通事故鉴定、犯罪举证和犯罪现场还原等具有重要意义。现有汽车声音识别算法存在算法复杂度高和识别率相对较低等问题。针对现行问题,将以梅尔倒谱系数( MFCC)特征与自相关函数(ACF)方差作为混合特征的汽车声音识别算法应用到汽车声音识别系统中。该算法使用高斯混合模型(GMM)进行汽车声音建模和识别,获得比MFCC特征及其一阶差分特征组成的混合特征更好的识别效果。并通过仿真实验证明了该算法的有效性。 相似文献
4.
5.
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 相似文献
6.
基于动态MFCC的说话人识别算法 总被引:1,自引:0,他引:1
《模式识别与人工智能》2005,18(5)
提出了一种基于动态MFCC特征的说话人识别算法.该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性.此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法.实验证明,本文所提出的方法在实际中能够获得较好的识别结果. 相似文献
7.
8.
利用MATLAB软件,设计了一种基于GMM模型的与文本无关的说话人辨认系统。该系统包括语音活动检测、提取MFCC参数、训练GMM参数和判决辨认四部分。经过TIMIT数据库测试,该系统的性能良好。 相似文献
9.
鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高. 相似文献
10.
11.
《信息与电脑》2019,(3)
脑卒中(cerebral stroke)又称中风、脑血管意外(cerebralvascular accident,CVA),是一种急性脑血管疾病,是我国成年人群致死、致残的首位病因,具有发病率高、致残率高、死亡率高和复发率高的特点。目前,针对脑卒中的治疗手段有限,而且疗效不太理想,预防是现阶段最好的治疗措施。为了有效预防脑卒中,笔者提出了一种基于深度学习和梅尔频率倒谱系数(Mel Frequency Cestrum Coefficient,MFCC)特征的脑卒中预测。首先,通过录音设备录取脑卒中患者和正常人的一小段特定语音;其次,对特定的语音做信号预处理,经预处理后对语音进行相应的梅尔变换,通过离散余弦变换获得MFCC语音特征;最后,将MFCC特征放入卷积神经网络进行模型训练,获取脑卒中的预测评价。实验结果表明,通过将MFCC特征输入到卷积神经网络进行模型训练,在预测准确性和鲁棒性方面具有较好表现。 相似文献
12.
提出一种基于改进GMM模型的耳语情感语音识别方法.该方法在GMM的每个成员通过用矢量量化误差值取代传统GMM的输出概率值来计算模型的得分,使得建模时所需训练数据量减少,并且识别速度有所提高.实验结果表明当训练数据较少时,提出的新的识别方法的实验结果明显好于传统的GMM方法,证明了该方法的有效性. 相似文献
13.
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 相似文献
14.
水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)作为目标特征提取的方法。通过对辐射噪声信号进行梅尔频率滤波得到目标噪声信号的MFCC特征,它模拟了人耳对不同频率的声音具有不同感知能力的听觉非线性效应,因此具有良好的识别效果。通过对实际水声目标的辐射噪声进行测试实验,提取目标噪声信号的MFCC特征向量,并运用K近邻算法对其进行分类识别,实验结果显示MFCC特征提取与分类识别算法对水声目标的识别率达到85%以上。 相似文献
15.
基于Fisher比的梅尔倒谱系数混合特征提取方法 总被引:1,自引:0,他引:1
针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高,并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比,识别率有一定程度的提高。 相似文献
16.
17.
赵玉晓顾秀秀张二华 《计算机与数字工程》2014,(2):243-247,307
由于传统的说话人识别中,常用的特征参数有线性预测系数(LPC)、Mel频率倒谱系数(MFCC),采用单一特征参数并不能很好地反映说话人特性.针对这种情况,提出了引入Delta特征和特征组合的方法.实验结果表明,引入Delta特征和特征组合对识别效果有明显提高,实验中选用GMM作为说话人识别模型. 相似文献
18.
19.
20.
随着语音技术的发展,以回放语音为代表的各种仿冒语音给声纹认证系统及音频取证技术带来了极大挑战。针对回放语音对声纹认证系统的攻击问题,提出一种基于修正倒谱特征的检测算法。首先,采用变异系数来分析原始语音和回放语音在频域上的差异;然后,有针对性地将提取梅尔倒谱系数(MFCC)过程中的Mel滤波器组换成由linear滤波器和逆Mel滤波器组合的新滤波器组,进而得到基于新滤波器组的修正倒谱特征;最后,使用高斯混合模型(GMM)作为分类器进行分类判别。实验结果表明,修正的倒谱特征能够有效地检测回放语音,其等错误率约为3.45%。 相似文献