首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
2.
有效的基于内容的音频特征提取方法   总被引:1,自引:1,他引:0       下载免费PDF全文
音频特征提取是音频分类的基础,好的特征将会有效提高分类精度。在提取频域特征Mel频率倒谱系数(MFCC)的同时,对每一帧信号做离散小波变换,提取小波域特征,把频域和小波域特征相结合计算其统计特征。通过SVM模型建立音频模板,对纯语音、音乐及带背景音乐的语音进行分类识别,取得了较高的识别精度。  相似文献   

3.
提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿真实验结果表明,该方法的识别率较高。  相似文献   

4.
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。  相似文献   

5.
尹许梅  何选森 《计算机工程》2011,37(11):192-194
为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换;在语音预处理阶段,利用改进的Lanczos窗函数抑制旁瓣以提高语音鲁棒性。实验表明,与传统MFCC方法相比,在噪声环境下,改进方法具有更高的说话人识别率。  相似文献   

6.
一种基于MFCC的音频数据检索方法   总被引:3,自引:1,他引:2  
以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性.因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法.通过实验对比分析结果表明,这种音频数据检索方法比LPCC的检索具有更高的识别率.  相似文献   

7.
声纹识别技术的关键是从语音信号中提取具有说话人特征的语音特征参数.考虑到当下大多是运用鉴定人的经验对两段语音是否来源于同一人进行判定,在前期研究的基础上,结合MFCC特征,提出一种基于ARIMA预测的声纹同一性鉴定方法,以提高具有年份差距的检材与样本比对的准确率.此方法在Mel倒谱系数声纹同一性鉴定方法基础上,采用自回...  相似文献   

8.
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+α△MFCC+β△△MFCC为特征参数的分类正确率明显高于MFCC、MFCC+△MFCC和MFCC+△MFCC+△MFCC。  相似文献   

9.
针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组合送入支持向量机进行辨识,并研究了针对4种方言的SDC的局部最优参数组合。仿真实验结果表明,同时考虑方言的静态与动态特征方法的识别率高达92.5%,但识别率的提高是以延长运算时间为代价的。  相似文献   

10.
声纹作为当代司法鉴定技术发展的产物,在现代声像资料鉴定中发挥了至关重要的作用.传统的声纹分析方法是基于声音处理工具进行手工分析的,考虑到其具有严格的文本相关性以及比对的臆断性的缺点,其作为证据鉴定意见的证明力有待加强.文中提出了一种基于Mel频率倒谱系数的同一性鉴定方法,即提取并量化包含原始声音的共振峰及其时间轴信息的包络作为声纹特征进行同一性比对.此方法改进了传统Mel频率倒谱系数的不足,提取共振峰的突变并将元音与响辅音的转变特性加入声纹特征,以提高其识别度.实验证明,此方法在检材与样本无关的情况下,同一性鉴定的准确率达到了85%,方差控制在9%左右,具有良好的同一性识别;而在非同一性鉴定中,该方法也能在结合人工分析的情况下给出较准确的结果.  相似文献   

11.
陈迪  龚卫国  杨利平 《计算机应用》2007,27(5):1217-1219
提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。  相似文献   

12.
语音MFCC特征提取的FPGA实现   总被引:2,自引:0,他引:2  
提出了在FPGA上实现语音MFCC特征提取的方法,巧妙设计了FFT、三角滤波、取对数和DCT的硬件结构,采hl多时钟、状态机、模块复用、IP核和多级流水技术,大大提高了运算速度,实验表明与软件相比,结果误差在l%以内,50M时钟频率下每秒语音数据计算时间仅为8.5 ms,与VQ、HMM结合后,对系统识别率影响可以忽略,达到了嵌入式实时系统的应用要求.  相似文献   

13.
改进的混合MFCC语音识别算法研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。  相似文献   

14.
赵欢  张林  陈珍文 《计算机应用》2009,29(2):389-391
为改善低信噪比环境下语音的质量,在传统MFCC特征提取的基础上,提出了两种提高识别系统鲁棒性的方法。一种方法利用混合窗函数对旁瓣的抑制来提高系统的鲁棒性;另一种方法是基于频谱峰值位置受背景噪声影响相对较小,将子带幅度信息和Mel子带频谱质心(MSSC)相结合。实验表明混合窗函数和子带频谱质心(MSSC)以及它们相结合的系统与使用传统MFCC的基准系统相比,在低信噪比的平稳噪声环境下系统的鲁棒性得到了一定的提高。  相似文献   

15.
提出心衰死亡率预测系统,预测心衰病人本次住院后30天内死亡率。基于上海曙光医院提供的心衰病人信息,首先对原始数据和特征进行预处理。由于特征的冗余性,再选用经典的Relief特征选择算法筛选出重要的心衰特征,最后选用bp-SVM算法来实现死亡率预测。实验结果证明,死亡率预测系统可以达到较高的性能并通过提供决策信息,辅助医生治疗病人。医生可以根据系统预测的病人死亡率的高低,采取不同的治疗方式,提高临床诊断结果和医院的资源分配。  相似文献   

16.
说话人识别中MFCC参数提取的改进   总被引:1,自引:0,他引:1  
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。  相似文献   

17.
融合LPC与MFCC的特征参数   总被引:1,自引:1,他引:1       下载免费PDF全文
张学锋  王芳  夏萍 《计算机工程》2011,37(4):216-217
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。  相似文献   

18.
超级计算机的规模不断扩大,与此同时,科学应用的复杂性也在不断增加,这导致了超级计算机上许多作业失败。作业失败会造成资源浪费,排队作业等待时间延长,严重影响系统的执行效率。提前预测作业失败,就可以采取必要的措施提升系统资源利用率和系统执行效率,这对未来的E级超级计算机至关重要。为此,尝试研究从已知的传统特征和构建特征中预测作业失败,发现能够反映用户工作行为模式和提交行为模式的特征及处理方式。通过结合行为特征和传统特征,提出基于树结构模型的综合框架来预测作业失败。实验结果表明,预测效果优于其他相关方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号