首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
俸云  景新幸 《计算机仿真》2009,26(10):327-329,343
美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统的基于MFCC的语音识别效果,与基于MFCC和残差相位相结合的语音识别效果进行比较。通过在MATLAB环境下进行仿真实验得出理想结论。利用MFCC和残差相位相结合的识别率高于MFCC的系统的识别率。所提出的改进算法更好的完善了识别系统,获得了更高的语音识别率。  相似文献   

2.
语音MFCC特征计算的改进算法   总被引:1,自引:0,他引:1  
提出了一种计算Mel频倒谱参数(Mel frequency cepstral coefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(Wrapped discrete Fourier transform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weighted filter bank analysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。  相似文献   

3.
杨海燕  吴雷  周萍 《测控技术》2019,38(5):88-93
在连续语音识别系统中,针对强噪声环境下传统双门限语音检测方法出现的误检问题,提出了一种结合压缩感知理论和MFCC倒谱系数的端点检测算法。该算法采用Hadamard随机观测矩阵和改进的OMP重构算法对语音信号进行压缩感知与重构,利用语音信号在离散余弦基上的近似稀疏性,提取重构信号的MFCC倒谱系数来检测语音信号的端点。仿真结果表明,提出的改进算法具有较强的鲁棒性,能满足在强噪声环境下对连续语音信号进行有效端点检测的要求。  相似文献   

4.
针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号,使得语音主观感知质量改善受限的情况,提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数,能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿;结合改进DD的先验信噪比估计与语音存在概率算法(SPP)来估计噪声功率谱;在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿(PSC)算法而言,改进算法可以有效抑制音频信号中的各类噪声,同时增强语音信号感知质量,提升语音的可懂度。  相似文献   

5.
改进的混合MFCC语音识别算法研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。  相似文献   

6.
通过研究语音残差信号的合成方法,给出了一种改进的波形内插(Waveform Interpolation,WI)编码器语音重建方案,去除了解码器中特征波形(Characteristic waveform,CW)的对齐运算。在该方案中当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。  相似文献   

7.
语音中存在加性噪声降低了MFCC参数的鲁棒性,使得说话人确认系统性能下降。多窗谱MFCC引入了多窗谱估计技术在增强 MFCC 特征的噪声鲁棒性上取得了一定效果,但改善的程度有限。为了使 MFCC 参数对噪声具有更强的鲁棒性,提出了一种改进的多窗谱 MFCC 提取算法。改进算法在多窗谱 MFCC 的基础上引入谱减思想,谱减法(Spectral Subtraction, SS)能够增强语音并降低噪音的干扰。因此,采用了Multitaper+SS组合的改进算法融合了两者的优势,具备了更好的性能。仿真结果表明,当测试语音中含有加性噪声时,与多窗谱 MFCC提取算法相比,采用改进的多窗谱 MFCC 的说话人确认系统性能在等错误率 EER 和最小检测代价函数值minDCF两项评测指标上都取得了更好的结果。  相似文献   

8.
主要研究了基于流形学习ISOP算法的语音特征提取。将流形学习ISOP算法应用到语音识别特征提取模块中。仿真实验结果表明,该算法与传统的特征提取算法MFCC、LPCC等相比,可以取得较高的识别率。  相似文献   

9.
尹许梅  何选森 《计算机工程》2011,37(11):192-194
为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换;在语音预处理阶段,利用改进的Lanczos窗函数抑制旁瓣以提高语音鲁棒性。实验表明,与传统MFCC方法相比,在噪声环境下,改进方法具有更高的说话人识别率。  相似文献   

10.
语音信号特征提取中Mel倒谱系MFCC的改进算法   总被引:7,自引:1,他引:6  
从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传统算法在语音识别系统中的差别。  相似文献   

11.
This paper proposes an unsupervised method for improving the automatic speaker segmentation performance by combining the evidence from residual phase (RP) and mel frequency cepstral coefficients (MFCC). This method demonstrates the complementary nature of speaker specific information present in the residual phase in comparison with the information present in the conventional MFCC. Moreover this method presents an unsupervised speaker segmentation algorithm based on support vector machine (SVM). The experiments show that the combination of residual phase and MFCC helps to identify more robustly the transitions among speakers.  相似文献   

12.
Automatic speaker verification (ASV) systems are highly vulnerable against spoofing attacks. Anti-spoofing, determining whether a speech signal is natural/genuine or spoofed, is very important for improving the reliability of the ASV systems. Spoofing attacks using the speech signals generated using speech synthesis and voice conversion have recently received great interest due to the 2015 edition of Automatic Speaker Verification Spoofing and Countermeasures Challenge (ASVspoof 2015). In this paper, we propose to use linear prediction (LP) residual based features for anti-spoofing. Three different features extracted from LP residual signal were compared using the ASVspoof 2015 database. Experimental results indicate that LP residual phase cepstral coefficients (LPRPC) and LP residual Hilbert envelope cepstral coefficients (LPRHEC) obtained from the analytic signal of the LP residual yield promising results for anti-spoofing. The proposed features are found to outperform standard Mel-frequency cepstral coefficients (MFCC) and Cosine Phase (CosPhase) features. LPRPC and LPRHEC features give the smallest equal error rates (EER) for eight spoofing methods out of ten spoofing attacks in comparison to MFCC and CosPhase features.  相似文献   

13.
在上下文无关的说话人识别应用中,针对传统MFCC特征参数在语音预处理方面不足以及三角滤波器组的缺陷,提出一种改进的MFCC特征参数提取方法.一方面在传统算法上加入端点检测,去除与说话人语音特征无关的静音段;另一方面用高斯滤波器组(Gaussian shaped filters GF)代替三角滤波器组进行频率到Mel频率的转换,提高识别准确率.说话人识别模型使用流行的高斯混合模型(GMM).实验结果显示,高斯滤波器组的引入相比于传统三角滤波器组识别率有4.45%的提升,本文改进后的MFCC特征参数相比于传统方法识别率也提升了6.43%,能更好的代表说话人的语音特征.  相似文献   

14.
Automatic speech recognition (ASR) system plays a vital role in the human–machine interaction. ASR system faces the challenge of performance degradation due to inconsistency between training and testing phases. This occurs due to extraction and representation of erroneous, redundant feature vectors. This paper proposes three different combinations at speech feature vector generation phase and two hybrid classifiers at modeling phase. In feature extraction phase MFCC, RASTA-PLP, and PLP are combined in different ways. In modeling phase, the mean and variance are calculated to generate the inter and intra class feature vectors. These feature vectors are further adopted by optimization algorithm to generate refined feature vectors with traditional statistical technique. This approach uses GA?+?HMM and DE?+?HMM techniques to produce refine model parameters. The experiments are conducted on datasets of large vocabulary isolated Punjabi lexicons. The simulation result shows the performance improvement using MFCC and DE?+?HMM technique when compared with RASTA-PLP, PLP using hybrid HMM classifiers.  相似文献   

15.
针对传统语音短时分析技术容易出现丢失信息的现状,提出了一种基于临界带宽的小波包变换算法,该算法借鉴传统倒谱特征参数(MFCC)提取的过程并在该过程中引入临界带宽(Critical Bandwidth)的概念。在基于高斯混合模型的说话人识别系统中进行实验,结果表明在选取不同小波包函数的情况下,该算法所取得的识别率较MFCC参数均有提高。  相似文献   

16.
在咳嗽识别中,频谱能量较高是咳嗽区别于大部分非咳嗽声音的主要特征,在分析得到咳嗽各子带频谱能量分布系数的基础上,提出了一种基于子带能量变换改进MFCC的咳嗽识别新方法。该方法在MFCC提取过程中引入子带能量变换,对高能量子带进行增强以降低非咳嗽信号的误识别率和提高轻微咳嗽的识别率,舍弃低能量子带以提高系统的抗干扰能力。在相同实验条件下,比较了采用改进MFCC和传统MFCC的咳嗽识别性能。实验结果表明:改进MFCC有效改善了咳嗽识别的各项评价指标和增强了算法的鲁棒性,平均识别率从89.29%提高到了94.43%。  相似文献   

17.
基于差分全相位MFCC的音符起点自动检测   总被引:1,自引:0,他引:1       下载免费PDF全文
关欣  李锵  田洪伟 《计算机工程》2010,36(11):25-26,29
针对现有的音符起点自动检测方法难以适用于多类音乐信号,计算复杂度较高等问题,提出一种基于差分全相位MFCC的检测算法。通过全相位预处理减小频谱泄露引起的频谱模糊,差分Mel频率倒谱考虑人耳对音乐不同频率响应的非线性特性和音乐信号的动态音乐特征。实验结果表明,与公认综合检测效果好的HFC和ICA等方法相比,该方法计算复杂度小,适用音乐信号类型广,具有更优的综合检测性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号