首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郭秋敏  刘晓文  徐博 《通信技术》2007,40(12):387-390
以Mel频率倒谱系数(MFCC)作为语音识别的特征参数,采用动态时间规整(DTW)识别算法,实现以数字信号处理器TMS320VC549为内核的语音识别。采用24阶MFCC作为特征量。软件系统直接对数字信号处理器进行编程,采用Mel频率倒谱系数定点算法计算特征参数,用动态时间规整算法搜索匹配路径。硬件系统采用单片机AT89C51实现与TMS320VC549的通信,在有信道噪声和频谱失真的情况下,能产生更高的识别精度。  相似文献   

2.
研究一种适合医疗仪器的语音识别算法,采用带噪声端点检测算法、美尔频标倒谱系数(MFCC)特征参数提取算法和整体路径约束DTW算法即ADTW算法,能有效地提高识别率和稳健性。在此为噪声环境下的语音识别提供了理论分析与仿真实验数据。实验结果表明:这种语音识别算法不仅有很高的识别率,而且能减小或者消除噪声所带来的训练模型和测试语音之间的失配。它完全满足医疗仪器对语音识别率的要求。  相似文献   

3.
文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。  相似文献   

4.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

5.
声纹识别技术,形象的说法就是说话人识别技术.它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术.本文所研究的是与文本有关的说话人确认系统.比较了基于声道的线性预测倒谱系数(LP CC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性.并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真.本实验系统的识别率达到了90%,验证了HMM模型识别的准确性.  相似文献   

6.
将语音识别技术应用于拨号系统,在嵌入式平台上实现了一款针对非特定人的数字语音拨号系统。语音识别算法中选择梅尔频率倒谱系数为特征参数,连续隐马尔科夫模型。为训练和识别过程模型,利用Qt界面对识别过程进行控制,系统针对非特定人数字语音识别进行实验。结果表明,系统针对非特定人识别率达到了98%,识别时间为3.55S。识别率和实时性都满足语音拨号的需求。  相似文献   

7.
基于不变集多小波的语音特征参数提取   总被引:1,自引:0,他引:1  
在研究不变集多小波理论的基础上,借鉴Mel频率倒谱系数(MFCC)的提取算法,用多小波交换代替傅里叶变换及Mel滤波.构造了一种新的语音特征参数MWBC。汉语数字识别实验结果表明,提出的新语音特征参数MWBC的识别性能和抗噪性能均优于MFCC,为提高语音识别系统的噪声鲁棒性提供了一条新途径。  相似文献   

8.
基于MFCC的说话人识别系统   总被引:7,自引:0,他引:7  
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC.  相似文献   

9.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法.  相似文献   

10.
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。  相似文献   

11.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

12.
屈晓渊  崔青 《电子设计工程》2022,30(9):82-87,92
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面.对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确度低、处理速度慢等方面的不足,提出了基于梅尔频率倒谱的音频分...  相似文献   

13.
提出了一种结合韵律信息的高性能汉语连续数字语音识别算法,该识别算法基于CHMM(连续隐马尔可夫模型),采用MFCC(MEL频率倒谱系数)为主要语音特征参数,结合韵律信息进行连续数字精确分割,能够有效区分易混数字。算法采用两级识别框架来提高语音识别率,其中,第1级对连续数字分割,在此基础上进行数字语音识别,输出各候选结果,第2级在候选结果中确定易混数字对,并运用韵律信息进一步选择正确结果。实验表明,最终汉语连续数字语音识别率有很大提高。  相似文献   

14.
自动检测正常嗓音和病理嗓音的关键是选出有效的特征参数,并对其进行优化得到简单易实现的参数。同时选择合适的识别模型对正常嗓音和病理嗓音进行识别以得到最好的识别率。为了能实时、便利地检测正常嗓音和病理嗓音,这里提出了线性预测倒谱系数(LPCC)和MEL频率倒谱系数(MFCC)声学特征参数,采用动态时间规整(DTW)算法进行识别,实验结果表明该模型的识别率可达到90%以上,且MFCC方法优于LPCC。  相似文献   

15.
端点检测是语音识别理论研究中的关键技术之一,为了提高语音端点检测方法的抗噪性和准确性,引入倒谱均值减(Cepstral Mean Subtraction,CMS)设计一种新的语音端点检测方法.在传统倒谱均值减算法的基础上,采用隐马尔可夫模型(Hidden Markov Model,HMM)提取最佳特征子集,利用二次分类...  相似文献   

16.
作为说话人识别特征参量的MFCC的提取过程   总被引:5,自引:0,他引:5  
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。  相似文献   

17.
马治飞  徐望  王炳锡  王兴斌 《信号处理》2005,21(Z1):192-195
本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.不同噪声环境和不同信噪比下的实验结果表明,本文方法能有效提高噪声环境下的中文连续语音识别的正确率.  相似文献   

18.
特征工程是机器学习中重要的一环。梅尔倒谱系统特征是语音的关键信息,提取该特征是语音识别的特征工程之一。首先分析了梅尔特征的提取过程,包括预加重、分窗、窗函数、短时傅里叶、能量普计算、三角滤波、取对数、离散余弦变换和倒谱抬升八个步骤,其中重点分析了窗函数和梅尔三角滤波,这两个过程因有多种算法应用于不同的语音识别场景。在三角滤波过程中,引入了梅尔尺度的概念。然后,把梅尔特征的提取步骤在Python语言中,使用librosa库函数中的mfcc函数进行关键步骤实现。结果表明,梅尔倒谱系特征是语音识别中的典型特征,其提取过程对于其它特征的提取具有广泛的借鉴意义。  相似文献   

19.
彭佩瑶  杜月山  韦峻峰 《电声技术》2022,(11):139-141+156
无声语音识别常以表面肌电信号作为研究对象。表面肌电信号的端点检测是影响识别结果的一个重要因素。表面肌电信号与语音信号有类似之处。借助语音端点检测的方法对表面肌电信号进行分割是一种可行的思路。基于此,采用子带谱熵和梅尔倒谱距离作为信号端点检测的判决依据,通过粒子群算法优化支持向量机分类器给出端点检测结果。结果表明,在不同信噪比条件下,该算法有最高的检出率与最低的错误率。对于基于K最近邻(K-Nearest Neighbor,KNN)的无声语音识别任务,识别率达95.3%。  相似文献   

20.
结合人耳听觉模型,利用人耳掩蔽特性,提出了一种基于小波分解和复倒谱变换的音频数字水印算法。该算法通过对原始语音信号进行三级小波分解,提取出小波近似分量,从近似分量中选取重要系数。利用复倒谱变换系数的不相关性.对重要系数进行复倒谱变换实现解相关运算,最终把水印嵌入到语音复倒谱域中,实现了在语音信号中嵌入二值图像,提高了水印嵌入算法的不可听性。实验证明该方法在抗常见的信号处理如加噪、滤波、重采样、有损压缩等方面具有较好的稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号