共查询到18条相似文献,搜索用时 125 毫秒
1.
2.
人脸语音动画是虚拟现实领域的热点,语音特征参数提取是实现语音同步动画的前提和关键所在。为了能够提取鲁棒性更好的语音特征参数,在小波变换的理论基础上,借鉴MFCC特征参数的提取方法,运用表征语音动态特征的特征差分算法,提出了一种基于离散小波变换的语音特征参数(DWTMFCC)提取方法,并与反映语音情感特征的韵律参数相结合。通过基于LGB算法的VQ模型进行说话人语音识别,可以得到组合特征参数的识别率较高。 相似文献
3.
语音特征参数MFCC(荚尔频标倒谱系数)是语音识别中最有效的特征参数之一,但由于MFCC参数的计算量太大而限制了其在低端嵌入式平台的应用l针对台湾凌阳公司的16位语音型单片机SPCE061A采用优化的双字定点算法研究了MFCC参数的快速提取方法,使得计算一帧256点(32ms)语音数据12阶的MFCC参数只需13.8ms,比未改进的浮点算法速度快30倍,达到了实用的目的。 相似文献
4.
基于小波包分析特征参数的说话人识别系统 总被引:5,自引:0,他引:5
介绍了说话人识别系统,研究MFCC提取原理与小波包分析的基础上,提出了一种基于小波包分析的新型语音特征参数WPDC。在研究了WPDC提取算法的基础上,建立了一个神经网络模型的说话人识别系统,实验比较了MFCC与WPDC的识别性能,验证WPDC了具有很高的识别率,是一种很好的语音特征参数。 相似文献
5.
研究一种适合医疗仪器的语音识别算法,采用带噪声端点检测算法、美尔频标倒谱系数(MFCC)特征参数提取算法和整体路径约束DTW算法即ADTW算法,能有效地提高识别率和稳健性。在此为噪声环境下的语音识别提供了理论分析与仿真实验数据。实验结果表明:这种语音识别算法不仅有很高的识别率,而且能减小或者消除噪声所带来的训练模型和测试语音之间的失配。它完全满足医疗仪器对语音识别率的要求。 相似文献
6.
7.
为了提高说话人识别中语音特征参数的鲁棒性,提取了新的特征参数DWT-MFCC,在提取该参数时利用了新构造的阈值函数,并基于高斯混合模型的说话人识别系统进行实验。实验结果表明,相对于传统的MEL倒谱系数(MFCC)参数,在相同的噪声环境下,DWT-MFCC参数具有更高的说话人识别率。 相似文献
8.
基于不变集多小波的语音特征参数提取 总被引:1,自引:0,他引:1
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。 相似文献
9.
10.
传统梅尔频率倒谱系数(MFCC)和线性预测倒谱系数(LPCC)特征的汽车鸣笛声识别方法在识别模型中分辨力不足,针对此问题,提出了一种基于变分模态分解(VMD)和ReliefF融合特征的汽车鸣笛声识别方法。该方法将变分模态分解所得的前四个模态分量进行信号重构,提取重构信号的MFCC、LPCC、声谱图特征参数。通过ReliefF算法融合MFCC和LPCC特征,并输入识别模型,实现汽车鸣笛声的准确识别。结果表明,该方法在BP模型中的识别率、识别速度均优于其他特征在BP、支持向量机、卷积神经网络识别模型中的识别效果,在汽车鸣笛声识别领域具有一定应用价值。 相似文献
11.
语音识别系统中,语音的特征提取是语音识别的关键技术之一。通过对语音的系统研究,提出一种全新的基于流形学习的特征提取方法。流形算法是近些年才发展起来的非线性降维方法,在人脸识别领域已取得较好效果,但在语音识别领域一直处于空白。现提出的基于流形学习LPP算法的语音特征提取方案,是一次重大的尝试,可以为以后深入研究语音识别技术提供较好参考。仿真实验结果表明,该算法与传统特征提取LPCC、MFCC算法相比,可以取得较好的识别率。 相似文献
12.
为了提高语音信号的识别率,提出了一种改进的语音信号特征提取算法。该算法在MFCC参数的基础上,增加每帧信号的短时能量和短时过零率,使得新参数能够更为准确地表征语音信号。通过仿真实验。说明了新特征参数取得了较高的识别率。 相似文献
13.
14.
应用于语音识别片上系统的语音检测算法 总被引:2,自引:0,他引:2
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。 相似文献
15.
16.
基于小波包变换和MFCC的说话人识别特征参数 总被引:1,自引:0,他引:1
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。 相似文献
17.
MFCC是语音识别中常用的特征参数,根据MFCC分量对语音端点的敏感性,提出利用平常舍去的识别特征参数分量MFCC0作为语音端点检测的参量.接着根据MFCC0的特性设计了一种新的端点检测方法,该方法简单且无需增加额外的计算量.实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率. 相似文献
18.
State-of-the-art automatic speech recognition (ASR) systems follow a well established statistical paradigm, that of parameterization of speech signals (a.k.a. feature extraction) at front-end and likelihood evaluation of feature vectors at back-end. For feature extraction, Mel-frequency cepstral coefficients (MFCC) and perceptual linear prediction (PLP) are the two dominant signal processing methods, which have been used mainly in ASR. Although the effects of both techniques have been analyzed individually, it is not known whether any combination of the two can produce an improvement in the recognition accuracy or not. This paper presents an investigation on the possibility to integrate different types of features such as MFCC, PLP and gravity centroids to improve the performance of ASR in the context of Hindi language. Our experimental results show a significant improvement in case of such few combinations when applied to medium size lexicons in typical field conditions. 相似文献