首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基频轮廓就是基频随时间变化的曲线,刻画了汉语中最主要的韵律特征-声调和语调的变化趋势。而藤崎模型则是日本东京大学藤崎博也教授建立的一种韵律模型,可以用来非常好地逼近汉语语音的基频轮廓。本文提出了一种基于该模型的从汉语单音节的基频轮廓中提取参数的方法,我们首先采用基于小波变换的基音检测技术(3)获取非常准确的给定单字的各基频值,并连接形成基频轮廓,然后根据最小均匀误差准则,用藤崎模型来拟合各基频点,  相似文献   

2.
基于小波调制尺度的语音特征参数提取方法   总被引:3,自引:0,他引:3  
马昕  杜利民 《计算机应用》2005,25(6):1342-1344
时频分析的理论基础上,提出了一种基于小波调制尺度特征的参数提取方法。根据人对调制谱信息的感知特性及干扰在调制谱中的特点,采用小波分析技术及归一化处理求得归一化的小波调制尺度特征参数,并以此作为语音的动态特征应用于语音识别系统。通过与MFCC一阶、二阶系数对比的汉语音节识别实验表明,该方法在抗噪声干扰和说话速率变化等方面比MFCC的一阶、二阶系数的性能优越,为提高语音识别鲁棒性提供了一种新途径。  相似文献   

3.
介绍一种基于新型小波听觉滤波器组的语音识别特征提取方法。按照人耳听觉临界频带带宽设计一组新型小波带通滤波器组,并详细计算给出构建新型小波滤波器所需要的尺度参数。采用SDA9000串行信号分析仪进行频谱分析,使用型号为MIC3000 Compact PCI Industrial Computer的LSP设备进行FPGA硬件仿真,使用协同神经网络进行模式识别,建立基于Matlab GUI的仿真界面,与高斯小波滤波器组模型所得仿真结果进行对比,从功率谱图和识别结果上进行分析,证明新型小波滤波器组具有更优的识别率和抗噪性。  相似文献   

4.
语音倒谱特征的研究   总被引:24,自引:1,他引:24  
语音倒谱特征是语音识别中最常用的特征参数,它表征了人类的听觉特征。该文在研究基于线性预测倒谱和非线性MEL刻度倒谱特征的基础上,研究了LPCC和MFCC参数提取的算法原理及提取算法,提出了一级、二级差分倒谱特征参数的提取算法。识别实验验证了MFCC参数的鲁棒性优于LPCC参数。  相似文献   

5.
一种基于语音学知识的汉语辅音分类方法   总被引:3,自引:0,他引:3  
文章提出一种提高汉语辅音识别性能的框架,在此框架下构造了一个基于声学—语音层分析的多级分类器,实现对全部汉语辅音的无重叠分类,测试了将辅音分类结果与概率统计模型结合的效果。重点讨论了用于汉语辅音分类的几种特征参数提取技术和实验结果。文章所提取的特征参数包括非嗓音段持续时间(DUP)、归一化的有效频带能量趋势等,涉及时域、频域和小波变换域等不同分析处理方法,特征参数简单、有效,具有较好的与后接元音无关和非特定人性质。分类器将21个汉语辅音分为5类,狖m,n,l,r狚,狖b,d,g狚,狖p,t,k,f,h狚,狖zh,ch,sh狚,狖z,c,s,j,q,x狚;其分类正确率分别达97.21%、97.10%,97.70%,93.31%和94.80%。实验所用的语音资料库包括21个话者的孤立字汉语辅音发音资料。  相似文献   

6.
通过对MFCC算法的研究,发现其中的FFT在整个时频空间使用固定的分析窗,这不符合语音信号的特性,而小波变换具有多分辨率特性,更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC参数的提取方法,用小波包变换代替傅里叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC,然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数。仿真实验证明:基于新特征的识别率比原来MFCC的识别率有了很大提高,特别是在低信噪比情况下。  相似文献   

7.
针对小波阈值选择的多样性,主要研究了小波自适应阈值消噪联合子空间增强对特定人汉语孤立词识别系统的鲁棒性提升。采用Mel倒谱系数,在基于矢量量化(VQ)和高斯混合模型(GMM)的两个系统上,检验采用联合Symlets小波多阈值消噪和子空间增强算法在互为先后顺序作用下系统的识别率,给出一个先Symlets小波阈值消噪再子空间增强的语音增强方法。人耳感官和Matlab实验证实该方法结合了两者的优点,不但平衡了语音失真和噪声抑制,亦可提高VQ系统的顽健性,而对于GMM系统作用有限。  相似文献   

8.
用于汉语单音节声调识别的基频轨迹拟合方法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于Target模型的思想,对汉语声调基频轨迹进行研究,总结了四种声调曲线参数的变化规律,提出了对基频轨迹进行分段曲线拟合的方法。使用该方法提取出的反映基频变化趋势的特征向量,在不受基频曲线两端不准确点影响的同时起到了长度归一化的作用。使用该向量进行声调识别,取得了95.17%的满意识别结果。  相似文献   

9.
基于听觉模型的语音特征提取   总被引:2,自引:1,他引:1  
分析了耳蜗对声音频率分解机理,毛细胞和听神经的能量转换机理以及中枢神经系统的侧抑制机理,分别在以上三个层次上建立了数学模型,并提取出识别语音特征参数。通过对听觉谱和LPC倒谱对比分析,得到了听觉谱适宜用作语音识别并具有良好的噪声鲁棒性的结论。听觉谱和LPC倒谱对比实验分析也反映了听觉模型特征的优良性能。  相似文献   

10.
梅尔倒谱系数(MFCC)模拟了人耳的听觉特性,在语音识别实际应用中取得了较高的识别率。本文研究了在噪声环境下提取MFCC的一般过程和方法,研究了对噪声信号在时域与频域中的处理方法。最后用HTK工具箱进行实验验证文中所用方法的识别性能,本系统与基本特征提取方法相比,识别率有很大提高。  相似文献   

11.
基于前置滤波和小波变换的带噪语音基音周期检测方法   总被引:10,自引:0,他引:10  
根据语音信号的基音周期范围有限和在声门闭合时刻语音信号出现锐变的特点,提出一种基于前置滤波和小波变换的基音周期检测方法。带噪语音信号经过3阶椭圆低通滤波器滤波后,采用以二次样条小波作为小波函数,进行一级小波变换检测语音信号的锐变点,再计算基音周期。实验表明,本文提出的基音周期检测方法,与平均幅度差函数(AMDF)和自相关函数(ACF)方法相比,提高了提取基音周期的准确率;与多尺度小波变换的基音周期检测方法相比,减小了计算量,削弱了噪声信号和语音的共振峰对基音周期检测的影响。  相似文献   

12.
The pitch is a crucial parameter in speech and music signals. However, due to severe noisy conditions, missing harmonics, unsuitable physical vibration, the determination of pitch presents a great challenge when desiring to get a good accuracy. In this paper, we propose a method for pitch estimation of speech and music sounds. Our method is based on the fast Fourier transform (FFT) of the multi-scale product (MP) provided by a feature auditory model of the sound signals. The auditory model simulates the spectral behaviour of the cochlea by a gammachirp filter-bank, and the out/middle ear filtering by a low-pass filter. For the two output channels, the FFT function of the MP is computed over frames. The MP is based on constituting the product of the speech and music wavelet transform coefficients at three scales. The experimental results show that our method estimates the pitch with high accuracy. Besides, our proposed method outperforms several other pitch detection algorithms in clean and noisy environments.  相似文献   

13.
针对基音周期检测中容易出现的半周期和倍周期错误,综合考虑了常用的小波变换和短时自相关方法的优缺点,以及相邻基音周期长度的渐变性,提出了把两者相结合的基音周期检测算法.对语音信号进行清浊音检测和前置带通滤波,利用小波变换方法进行初步检测,对基音周期变化过大的情况使用自相关方法进行验证.实验结果表明,该方法在不同信噪比下的基音周期检测准确率都明显高于普通的小波变换检测方法.同时,该方法还有助于通过人工方式快速修正基音周期.  相似文献   

14.
三字词音节声调模式具有连续语音中音节声调模式的特征,声调的提取和识别远较孤立字困难。采用小波变换方法提取语音基音,用Fuzzy ARTMAP神经网络进行声调识别,获得了比BP网络更好的实验结果。分析了仿真参数对识别结果的影响,讨论了Fuzzy ARTMAP神经网络中的过拟合问题,给出了一种基于Fuzzy ARTMAP神经网络的三字词声调识别方法。  相似文献   

15.
基于自相关平方函数与小波变换的基音检测   总被引:2,自引:0,他引:2  
林琴  郭玉堂  刘亚楠 《计算机应用》2009,29(5):1433-1436
在背景噪声干扰条件下,研究语音信号的基音周期,提出了一种基于自相关平方函数与小波变换结合的基音检测算法。该算法先用小波变换对带噪语音去噪,然后再求语音的自相关平方函数以突出真实基音周期的峰值,以获取较精确的基音周期。实验结果表明,与传统的自相关法相比,该算法鲁棒性好,具有更高的准确性,且计算复杂度低,利于语音合成和编码的实时处理。  相似文献   

16.
The paper proposes an innovative technique for generation of optimal mother wavelet using LPC trajectory with special reference to speech recognition. A new wavelet based model is proposed for speech signal processing. Lower order linear predictor coefficients (LPC) are related to the vocal tract area near lip that is the articulating organ. The trajectory of second LPC is proposed for the generation of mother wavelet for speech recognition. The observation interval is selected as the pitch period that represents one complete cycle of speech waveform. LPC of order 10 are evaluated for each pitch synchronous (PS) segment. An innovative technique is proposed for the generation of mother wavelet. The mother wavelet is separately generated for each word utterance. This generates a multidimensional space for speech words and increases the recognition accuracy. The wavelet transform (WT) coefficients are evaluated with respect to the generated mother wavelet for each word utterance and are stored as template along with the generated mother wavelet for each word utterance. The data base consists of 30 word utterances recorded locally using the sound recorder facility. In the recognition mode, the external word utterance is scanned and is divided into PS segments. The trajectory of second LPC is tracked. WT coefficients are evaluated with respect to the mother wavelet of each word in the vocabulary and are compared with the template for each word. The results indicate 100% recognition accuracy.  相似文献   

17.
噪声环境下的基音检测在语音信号分析和识别中占有重要地位。二次谱法是基于倒谱法的一种改进的基音检测方法。本文结合二次谱法和小波变换的去噪特性,提出了一种有效的噪声环境下的基音检测方法。实验表明,在信噪比较低的情况下,该法也能较精确的检测基音周期。  相似文献   

18.
噪声环境下的基音检测在语音信号处理中占有重要地位。为了有效提取低信噪比情况下的语音基音周期,提出了一种基于小波包变换加权线性预测自相关的检测方法。该方法首先利用小波包自适应阈值消除噪声,将多级小波包变换的近似分量求和以突出基音信息,并采用小波包系数加权线性预测误差自相关的方法突出基音周期处的峰值,提高了基音周期检测的精度。实验结果表明,与传统的自相关法、小波加权自相关法相比,该方法鲁棒性好,基音轨迹平滑,具有更高的准确性,即使在信噪比为-5dB时仍能取得较为理想的结果。  相似文献   

19.
一种Bark子波变换的电子耳蜗语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种Bark子波变换的电子耳蜗语音增强算法。该算法首先引入与人耳听觉系统更为适应的Bark子波变换来进行电子耳蜗CIS语音信号处理,然后在每个Bark通道中利用非线性谱减法对其进行语音增强,谱减法的参数由人耳隐蔽阈值来控制。结果表明:即使在低信噪比的情况下,信噪比也能提高16 dB左右,合成的语音对于电子耳蜗使用者具有较好的清晰度和可懂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号