期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

MFCC特征改进算法在语音识别中的应用 总被引：2，自引：0，他引：2

下载免费PDF全文

俸云景新幸叶懋《计算机工程与科学》2009,31(12)

本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。相似文献

2.

改进的混合MFCC语音识别算法研究 总被引：3，自引：0，他引：3

下载免费PDF全文

袁正午肖旺辉《计算机工程与应用》2009,45(33):108-110

针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。相似文献

3.

基于WDFT的语音PLP特征提取算法

章熙春曹燕张军韦岗《模式识别与人工智能》2005,18(4)

提出了一种基于WDFT的PLP特征提取算法.该算法采用WDFT来提高语音信号低频部分的频谱分辨率,与传统的提取方法相比更符合人类听觉系统的特性.对0～9十个英文数字和E-SET集的识别实验结果表明,本文提出的特征提取算法比传统PLP算法具有更好的识别效果. 相似文献

4.

分布式语音识别参数提取的改进算法及实现

叶蕾方鹏《福建电脑》2007,(5):91-91,78

本文介绍了分布式语音识别系统,对该系统中参数提取算法做了两种改进,并用Microsoft Visual C 6.0验证这两种改进算法可以提高噪声环境下识别系统的正确识别率. 相似文献

5.

语音识别中DTW改进算法的研究 总被引：1，自引：0，他引：1

胡金平陈若珠李战明《微型机与应用》2011,30(3):30-32

动态时间规整DTW是语音识别中的一种经典算法。对此算法提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数MFCC,并采用计算量相对较小的改进的动态时间规整算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用Matlab进行了算法仿真。试验结果表明,改进后的算法能够有效地提高系统对语音的识别率。相似文献

6.

基于EMD的改进MFCC的语音情感识别

屠彬彬于凤芹《计算机工程与应用》2012,48(18):119-122

人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明：改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。相似文献

7.

基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究

张钰莎蒋盛益《计算机应用与软件》2020,37(8):160-165,212

相似文献

8.

结合MFCC分析和仿生模式识别的语音识别研究

下载免费PDF全文

王宪保陈勇汤丽平《计算机工程与应用》2011,47(12):20-22

提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。相似文献

9.

结合残差相位的MFCC特征改进算法

俸云景新幸《计算机仿真》2009,26(10):327-329,343

美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统的基于MFCC的语音识别效果,与基于MFCC和残差相位相结合的语音识别效果进行比较。通过在MATLAB环境下进行仿真实验得出理想结论。利用MFCC和残差相位相结合的识别率高于MFCC的系统的识别率。所提出的改进算法更好的完善了识别系统,获得了更高的语音识别率。相似文献

10.

基于时频分布与MFCC的说话人识别

金银燕于凤芹何艳《计算机系统应用》2012,21(4):189-192,178

针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。相似文献

11.

基于MFCC的频谱重构实现音高估计和发声分类

张少华秦会斌《测控技术》2019,38(11):86-89

音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义。提出了一种新型音高估计和发声分类方法。利用梅尔频率倒谱系数（MFCC）进行频谱重构,并在对数下对重构的频谱进行压缩和过滤。通过高斯混合模型（GMM）对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%。基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型。相似文献

12.

一种改进的MFCC参数提取方法

王彪《计算机与数字工程》2012,40(4):19-21

为了提高语音识别率,提出了一种改进的MFCC参数提取方法。该方法应用小波包变换高分辨率的特点和语音高频加权的功能,在传统MFCC参数的基础上提取了一种新特征参数。新参数能对语音信号频率进行更加精细的划分,能够更稳定地减小频谱失真,且在一定程度上降低了信号的噪声。最后采用高斯混合模型（GMM）进行说话人语音识别,实验表明新特征参数取得了较好的识别率。相似文献

13.

基于Bark子波变换的MFCC特征提取

下载免费PDF全文

尹许梅何选森《计算机工程》2011,37(11):192-194

为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换;在语音预处理阶段,利用改进的Lanczos窗函数抑制旁瓣以提高语音鲁棒性。实验表明,与传统MFCC方法相比,在噪声环境下,改进方法具有更高的说话人识别率。相似文献

14.

一种改进动态特征参数的话者语音识别系统

申小虎万荣春张新野《计算机仿真》2015,32(4):154-158

研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率.但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低.为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法.上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度.利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类.在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率. 相似文献

15.

基于MFCC-IMFCC和GA-SVM的鸟声识别

韩鹏飞陈晓《计算机系统应用》2022,31(11):393-399

鸟声识别研究中声音特征选取对识别分类的准确度有很大影响.为了提高鸟声识别正确率,针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足.提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合,得到新的特征参数MFCC-IMFCC应用于鸟声识别,提高对鸟声高频信息表征.同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化,训练出GA-SVM分类模型.实验表明,在同一条件下,MFCC-IMFCC与MFCC相比,识别率有一定的提高. 相似文献

16.

采用主成分分析的特征映射 总被引：1，自引：0，他引：1

郭武 DAI Li-Rong 王仁华《自动化学报》2008,34(8):876-879

在与文本无关的说话人识别研究中, 特征映射的方法可以有效减少信道的影响. 本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间, 然后通过映射的方法在特征参数域中减去信道因子的影响. 采用这种方法需要有信道信息标记的数据, 但是在特征映射时不需要对信道进行判决. 在NIST 2006年SRE 1conv4w-1conv4w数据库上, 采用本文推荐方法的系统相对基线系统在等错误率上降低了19\%. 相似文献

17.

一种改进的基于说话者的语音分割算法 总被引：13，自引：1，他引：13

卢坚毛兵孙正兴张福炎《软件学报》2002,13(2):274-279

语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法. 相似文献