首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法   总被引:1,自引:0,他引:1  
提出一种基于语音增强算法的噪声鲁棒语音识别方法.在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比.然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声.实验结果表明,在低信噪比(-12—0 dB)条件下,该方法对于数字语音识别具有较好的识别率,其性能明显优于基本的Mel频段倒谱参数识别器、传统的谱减法和噪声对消语音增强法.  相似文献   

2.
邓蕾  高勇 《计算机系统应用》2017,26(12):227-232
针对噪声环境中说话人识别性能急剧下降的问题. 提出了一种用于说话人识别的鲁棒特征提取的方法. 采用弯折滤波器组(Warped filter banks,WFBS)来模拟人耳听觉特性,将立方根压缩算法、相对谱滤波技术(RASTA)、倒谱均值方差归一化算法(CMVN)引入到鲁棒特征的提取中. 在高斯混合模型(GMM)下进行仿真,实验结果表明该方法提取的特征参数在鲁棒性和识别性能上均优于MFCC特征参数和CFCC特征参数.  相似文献   

3.
提出一种用于语音识别的鲁棒特征提取算法。该算法基于子带主频率信息,实现子带主频率信息与子带能量信息相结合,在特征参数中保留语谱中子带峰值位置信息。使用该算法设计抗噪孤立词语音识别系统,分别在白高斯噪声和背景语音噪声环境下,与传统特征算法做多种信噪比对比实验。试验结果表明该特征算法在2种噪声环境下的识别率有不同程度提高,具有良好的噪声鲁棒性。  相似文献   

4.
在概率模型中,给出了引入倒谱预测值的动态相关性来进行特征补偿的方法。该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度,在倒谱域中对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度。不同噪声环境和不同信噪比下的实验结果表明,该方法能有效地提高噪声环境下的中文连续语音识别的正确率。  相似文献   

5.
基于自适应子带功率谱熵的语音端点检测算法   总被引:1,自引:1,他引:1  
在语音处理中,鲁棒性端点检测是语音处理最重要的领域之一,首先提出了一种子带功率谱熵(SPSE)的特征参数,然后,该参数结合Wuetal提出的自适应子带方法(ABS);发现了一种新颖的鲁棒特征参数-自适应子带谱熵(ASPSE),它能成功地在不同的背景噪声下检测语音端点。实验结果表明,在不同的噪声环境和信噪比下,ASPSE参数非常有效,而且该算法优于其它算法。  相似文献   

6.
针对复杂噪声干扰环境中语音特征参数会发生改变,引起训练模型和测试语音之间的失配,使语音识别系统的识别率降低,为提高语音特征参数在色噪声环境中提取的鲁棒性,提出了基于总体最小二乘旋转不变子空间技术(TLS-ESPRIT)谐波倒谱加权谱鲁棒特征参数提取方法.运用TLS-SVD方法对观测数据矩阵进行广义特征值分解估计谐波模型的参数,实现了有色噪声背景下语音信号的最优估计.在重建语音的过程中根据谐波能量与带噪语音能量的比值,对重建谐波的各个谐波峰给予不同的加权和语音建模,并进行仿真,结果实现了鲁棒性特征参数的提取,解决了模型之间的失配问题.  相似文献   

7.
为提高说话人识别中语音特征参数对噪声的鲁棒性,本文提出在对语音进行小波包分解基础上,分析噪声的特性,在不同子带内进行谱减并设立权重,提出了一种新的语音特征参数多层美尔倒谱系数.仿真实验表明,与MFCC特征参数相比,ML-MFCC在噪声环境下具有更好的抗噪性能和说话人识别率.  相似文献   

8.
基于对数能量倒谱特征的端点检测算法   总被引:1,自引:0,他引:1  
端点检测技术是语音识别的关键技术之一,为了克服传统倒谱距离语音端点检测算法在低信噪比下检测效果的不理想,将对数能量(LE)特征和倒谱(C)特征相结合,提出了一种新的对数能量倒谱特征(LEC),采用模糊C均值聚类和贝叶斯信息准则(BIC)方法估计特征门限,得出了正确的语音端点判断,在三种典型噪声下,对信噪比从-5 dB到15 dB的带噪声语音进行仿真,结果表明LEC法的检测错误率仅为20.25%,明显低于倒谱法和对数能量法,能有效地确定语音的端点并改善语音识别效果。  相似文献   

9.
抗噪声语音识别及语音增强算法的应用   总被引:1,自引:0,他引:1  
汤玲  戴斌 《计算机仿真》2006,23(9):80-82,143
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。  相似文献   

10.
张毅  汪培培  罗元 《信息与控制》2016,45(3):355-360
针对语音识别系统受噪声干扰识别率急剧下降的问题,通过分析传统的鲁棒语音特征提取方法在语音信号谱估计方面的不足,提出一种在不同信噪比下都具有较好鲁棒性和识别性能的语音特征提取算法.该算法结合多信号分类法(MUSIC)和最小模法(minimum-norm method,MNM)来进行谱估计.接着在移动机器人平台上进行验证实验,结果表明:该算法能有效的提高语音识别率,增强语音识别鲁棒性能.  相似文献   

11.
噪声谱估计算法在单通道语音增强方法中起着重要作用,为了改善噪声谱估计算法对噪声的估计和更新能力,结合最小统计(MS)算法,对改进的基于控制的递归平均(IMCRA)噪声谱估计算法的递归平均参数进行改进,并用一阶递归的方式对平滑功率谱的最小值进行改进。采用谱减法对含噪语音信号作去噪处理,从客观和主观两方面对不同算法的性能进行评价,对比分析不同噪声不同信噪比下增强前后语音的分段信噪比(segSNR)、PESQ得分、MOS得分。实验结果表明,提出的方法能够更好地跟踪噪声信号变化,改善语音质量。  相似文献   

12.
基于萤火虫算法的匹配追踪用于生态声音辨识   总被引:1,自引:0,他引:1  
针对生态环境中背景噪声对声音辨识产生干扰的问题,提出利用萤火虫算法优化匹配追踪的方法进行生态声音辨识。利用匹配追踪(MP)稀疏分解声音信号,在保留信号主体结构的前提下对其进行重构,减小噪声的影响。使用萤火虫(GSO)算法优化搜索最佳匹配原子,实现MP快速分解。对重构信号提取Mel频率倒谱系数(MFCCs),MP时频特征及基音频率。结合支持向量机(SVM)对56种生态声音在不同环境和信噪比情况下进行分类识别。实验结果表明,与传统MFCC与SVM的方法相比,该方法对生态声音在不同信噪比下的识别性能得到不同程度的改善并且具有较好的抗噪性,尤其适合低信噪比(30 dB以下)噪声情境下使用。  相似文献   

13.
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验表明,通过调整发音特征之问的异步约束,AF- AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有...  相似文献   

14.
柏财通  崔翛龙  郑会吉  李爱 《计算机应用》2022,42(10):3217-3223
针对标注神经网络训练数据的成本日益增加与噪声干扰阻碍语音识别系统性能提升的问题,提出一种基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法。首先,在预处理阶段提取原始语音样本的三个人工特征;然后,在训练阶段将特征提取网络生成的高级特征分别通过三个浅层网络来拟合预处理阶段提取的人工特征;同时,把特征提取前端与语音识别后端进行交叉训练,并合并它们的损失函数;最后,通过梯度反向传播令特征提取网络学会提取更有助于去噪语音识别的高级特征,从而实现人工知识迁移与去噪,并高效利用了训练数据。在军事装备控制的应用场景下,基于加噪后的THCHS-30、希尔贝壳数据集AISHELL-1与ST-CMDS这三个开源中文语音识别数据集以及军事装备控制指令的数据集上进行测试,实验结果表明,基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法词错率可以降低到0.12,不仅可以实现对鲁棒性语音识别模型的模型训练,同时通过自监督知识迁移提高了训练样本的利用率,可完成装备控制任务。  相似文献   

15.
An analysis-based non-linear feature extraction approach is proposed, inspired by a model of how speech amplitude spectra are affected by additive noise. Acoustic features are extracted based on the noise-robust parts of speech spectra without losing discriminative information. Two non-linear processing methods, harmonic demodulation and spectral peak-to-valley ratio locking, are designed to minimize mismatch between clean and noisy speech features. A previously studied method, peak isolation [IEEE Transactions on Speech and Audio Processing 5 (1997) 451], is also discussed with this model. These methods do not require noise estimation and are effective in dealing with both stationary and non-stationary noise. In the presence of additive noise, ASR experiments show that using these techniques in the computation of MFCCs improves recognition performance greatly. For the TI46 isolated digits database, the average recognition rate across several SNRs is improved from 60% (using unmodified MFCCs) to 95% (using the proposed techniques) with additive speech-shaped noise. For the Aurora 2 connected digit-string database, the average recognition rate across different noise types, including non-stationary noise background, and SNRs improves from 58% to 80%.  相似文献   

16.
通过MFFC计算出的语音特征系数,由于语音信号的动态性,帧之间有重叠,噪声的影响,使特征系数不能完全反映出语音的信息。提出一种隐马尔可夫模型(HMM)和小波神经网络(WNN)混合模型的抗噪语音识别方法。该方法对MFCC特征系数利用小波神经网络进行训练,得到新的MFCC特征系数。实验结果表明,在噪声环境下,该混合模型比单纯HMM具有更强的噪声鲁棒性,明显改善了语音识别系统的性能。  相似文献   

17.
含噪语音实时迭代维纳滤波   总被引:1,自引:1,他引:0       下载免费PDF全文
针对传统去噪方法在强背景噪声情况下,提取声音信号的能力变弱甚至失效与对不同噪声环境适应性差,提出了迭代维纳滤波声音信号特征提取方法。给出了语音噪声频谱与功率谱信噪比迭代更新机制与具体实施方案。实验仿真表明,该算法能有效地去噪滤波,显著地提高语音识别系统性能,且在不同的噪声环境和信噪比条件下具有鲁棒性。该算法计算代价小,简单易实现,适用于嵌入式语音识别系统。  相似文献   

18.
通过对MFCC算法的研究,发现其中的FFT在整个时频空间使用固定的分析窗,这不符合语音信号的特性,而小波变换具有多分辨率特性,更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法,首先在特征参数提取中引入了小波包变换,借助MFCC参数的提取方法,用小波包变换代替傅里叶变换和Mel滤波器组,提取了新的静态特征参数DWPTMFCC,然后把它与一阶DWPTMFCC差分参数相结合成一个向量,作为一帧语音信号的参数。仿真实验证明:基于新特征的识别率比原来MFCC的识别率有了很大提高,特别是在低信噪比情况下。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号