共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
研究一种适合医疗仪器的语音识别算法,采用带噪声端点检测算法、美尔频标倒谱系数(MFCC)特征参数提取算法和整体路径约束DTW算法即ADTW算法,能有效地提高识别率和稳健性。在此为噪声环境下的语音识别提供了理论分析与仿真实验数据。实验结果表明:这种语音识别算法不仅有很高的识别率,而且能减小或者消除噪声所带来的训练模型和测试语音之间的失配。它完全满足医疗仪器对语音识别率的要求。 相似文献
3.
4.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。 相似文献
5.
6.
将语音识别技术应用于拨号系统,在嵌入式平台上实现了一款针对非特定人的数字语音拨号系统。语音识别算法中选择梅尔频率倒谱系数为特征参数,连续隐马尔科夫模型。为训练和识别过程模型,利用Qt界面对识别过程进行控制,系统针对非特定人数字语音识别进行实验。结果表明,系统针对非特定人识别率达到了98%,识别时间为3.55S。识别率和实时性都满足语音拨号的需求。 相似文献
7.
基于不变集多小波的语音特征参数提取 总被引:1,自引:0,他引:1
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。 相似文献
8.
基于MFCC的说话人识别系统 总被引:7,自引:0,他引:7
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC. 相似文献
9.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法. 相似文献
10.
11.
12.
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面.对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确度低、处理速度慢等方面的不足,提出了基于梅尔频率倒谱的音频分... 相似文献
13.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。 相似文献
14.
15.
16.
作为说话人识别特征参量的MFCC的提取过程 总被引:5,自引:0,他引:5
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。 相似文献
17.
18.
特征工程是机器学习中重要的一环。梅尔倒谱系统特征是语音的关键信息,提取该特征是语音识别的特征工程之一。首先分析了梅尔特征的提取过程,包括预加重、分窗、窗函数、短时傅里叶、能量普计算、三角滤波、取对数、离散余弦变换和倒谱抬升八个步骤,其中重点分析了窗函数和梅尔三角滤波,这两个过程因有多种算法应用于不同的语音识别场景。在三角滤波过程中,引入了梅尔尺度的概念。然后,把梅尔特征的提取步骤在Python语言中,使用librosa库函数中的mfcc函数进行关键步骤实现。结果表明,梅尔倒谱系特征是语音识别中的典型特征,其提取过程对于其它特征的提取具有广泛的借鉴意义。 相似文献
19.