共查询到18条相似文献,搜索用时 250 毫秒
1.
2.
音频特征提取是音频分类的基础,好的特征将会有效提高分类精度。在提取频域特征Mel频率倒谱系数(MFCC)的同时,对每一帧信号做离散小波变换,提取小波域特征,把频域和小波域特征相结合计算其统计特征。通过SVM模型建立音频模板,对纯语音、音乐及带背景音乐的语音进行分类识别,取得了较高的识别精度。 相似文献
3.
4.
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。 相似文献
5.
6.
一种基于MFCC的音频数据检索方法 总被引:3,自引:1,他引:2
以LPC倒谱系数(LPCC)为特征参数的音频数据检索是人们常用的一种方法,但这种方法没有充分考虑到人耳听觉的非线性特性.因此,提出了一种采用MFCC及其差分倒谱系数相结合作为特征参数来做音频数据检索的方法.通过实验对比分析结果表明,这种音频数据检索方法比LPCC的检索具有更高的识别率. 相似文献
7.
8.
提出了基于Mel倒谱系数和加权的一阶、二阶差分Mel倒谱系数特征参数组合的环境音分类,实验结果表明以MFCC+α△MFCC+β△△MFCC为特征参数的分类正确率明显高于MFCC、MFCC+△MFCC和MFCC+△MFCC+△MFCC。 相似文献
9.
针对MFCC仅反映语音静态特征导致的方言识别率低的问题,而SDC由于考虑了前后帧差分倒谱的影响,能反映语音的动态特征;同时考虑方言的静态与动态特征,对普通话、上海话、广东话和闽南话4种方言进行MFCC特征和SDC特征提取,将其两组特征组合送入支持向量机进行辨识,并研究了针对4种方言的SDC的局部最优参数组合。仿真实验结果表明,同时考虑方言的静态与动态特征方法的识别率高达92.5%,但识别率的提高是以延长运算时间为代价的。 相似文献
10.
声纹作为当代司法鉴定技术发展的产物,在现代声像资料鉴定中发挥了至关重要的作用.传统的声纹分析方法是基于声音处理工具进行手工分析的,考虑到其具有严格的文本相关性以及比对的臆断性的缺点,其作为证据鉴定意见的证明力有待加强.文中提出了一种基于Mel频率倒谱系数的同一性鉴定方法,即提取并量化包含原始声音的共振峰及其时间轴信息的包络作为声纹特征进行同一性比对.此方法改进了传统Mel频率倒谱系数的不足,提取共振峰的突变并将元音与响辅音的转变特性加入声纹特征,以提高其识别度.实验证明,此方法在检材与样本无关的情况下,同一性鉴定的准确率达到了85%,方差控制在9%左右,具有良好的同一性识别;而在非同一性鉴定中,该方法也能在结合人工分析的情况下给出较准确的结果. 相似文献
11.
12.
语音MFCC特征提取的FPGA实现 总被引:2,自引:0,他引:2
提出了在FPGA上实现语音MFCC特征提取的方法,巧妙设计了FFT、三角滤波、取对数和DCT的硬件结构,采hl多时钟、状态机、模块复用、IP核和多级流水技术,大大提高了运算速度,实验表明与软件相比,结果误差在l%以内,50M时钟频率下每秒语音数据计算时间仅为8.5 ms,与VQ、HMM结合后,对系统识别率影响可以忽略,达到了嵌入式实时系统的应用要求. 相似文献
13.
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 相似文献
14.
15.
提出心衰死亡率预测系统,预测心衰病人本次住院后30天内死亡率。基于上海曙光医院提供的心衰病人信息,首先对原始数据和特征进行预处理。由于特征的冗余性,再选用经典的Relief特征选择算法筛选出重要的心衰特征,最后选用bp-SVM算法来实现死亡率预测。实验结果证明,死亡率预测系统可以达到较高的性能并通过提供决策信息,辅助医生治疗病人。医生可以根据系统预测的病人死亡率的高低,采取不同的治疗方式,提高临床诊断结果和医院的资源分配。 相似文献
16.
说话人识别中MFCC参数提取的改进 总被引:1,自引:0,他引:1
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 相似文献
17.
18.
超级计算机的规模不断扩大,与此同时,科学应用的复杂性也在不断增加,这导致了超级计算机上许多作业失败。作业失败会造成资源浪费,排队作业等待时间延长,严重影响系统的执行效率。提前预测作业失败,就可以采取必要的措施提升系统资源利用率和系统执行效率,这对未来的E级超级计算机至关重要。为此,尝试研究从已知的传统特征和构建特征中预测作业失败,发现能够反映用户工作行为模式和提交行为模式的特征及处理方式。通过结合行为特征和传统特征,提出基于树结构模型的综合框架来预测作业失败。实验结果表明,预测效果优于其他相关方法。 相似文献