共查询到20条相似文献,搜索用时 125 毫秒
1.
2.
3.
基于语音增强失真补偿的抗噪声语音识别技术 总被引:1,自引:0,他引:1
本文提出了一种基于语音增强失真补偿的抗噪声语音识别算法。在前端,语音增强有效地抑制背景噪声;语音增强带来的频谱失真和剩余噪声是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿。实验结果表明,此算法能够在非常宽的信噪比范围内显著的提高语音识别系统在噪声环境下的识别精度,在低信噪比情况下的效果尤其明显,如对-5dB的白噪声,相对于基线识别器,该算法可使误识率下降67.4%。 相似文献
4.
5.
针对现有的助听器语音增强算法在非平稳噪声环境下,残留大量背景噪声的同时还引入了“音乐噪声”,致使增强语音可懂度和信噪比不理想等问题。提出了一种基于噪声估计的二值掩蔽语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。采用最小值控制递归平均(Minima-Controlled Recursive Averaging,MCRA)算法获得估计噪声和初步增强语音;将估计噪声和初步增强语音分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,得到各自的时频表示形式;利用人耳的听觉掩蔽特性,计算含噪语音在时频域的二值掩蔽;利用二值掩蔽得到增强语音。实验结果表明:该算法很大程度上去除了谱减法引入的“音乐噪声”,与基于MCRA谱减法相比,增强语音的语言可懂度指数(Speech Intelligibility Index,SII)、主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)和信噪比(Signal to Noise Ratio,SNR)都得到了提高。 相似文献
6.
针对多噪声环境下的语音识别问题,提出了将环境噪声作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪声环境下的声学模型两层组成,通过含噪语音分类模型降低训练数据与测试数据的差异,消除了特征空间研究对噪声稳定性的限制,并且克服了传统多类型训练在某些噪声环境下识别准确率低的弊端,又通过深度神经网络(DNN)进行声学模型建模,进一步增强声学模型分辨噪声的能力,从而提高模型空间语音识别的噪声鲁棒性。实验中将所提模型与多类型训练得到的基准模型进行对比,结果显示所提层级语音识别模型较该基准模型的词错率(WER)相对降低了20.3%,表明该层级语音识别模型有利于增强语音识别的噪声鲁棒性。 相似文献
7.
1.引言 当前有很多语音识别系统和产品,但绝大部分是工作衣安静环境下的,一旦在噪环境下使用,语音信号中混人严重的背景噪声,信噪比就大为下降,影响了参数的稳定性,而通常采用的语音特征在 相似文献
8.
9.
10.
为消除语音信号中噪声,改善语音质量,本文提出一种改进的减谱法。首先根据每帧的功率谱动态调整谱减系数,然后通过维纳滤波法把各种噪声变换为类似白噪声的噪声,最后用原减谱法把该噪声去除。实验证明,该方法有较好的去噪效果。 相似文献
11.
12.
提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。 相似文献
13.
噪音环境下的语音识别一直是语音识别的难点,本文采用了谱减法进行去噪,进行孤立词(数字0-9)的识别,提高系统的识别率 相似文献
14.
噪音环境下的语音识别一直是语音识别的难点,本文采用了谱减法进行去噪,进行孤立词(数字0-9)的识别,提高系统的识别率. 相似文献
15.
随着手持设备的日益小型化以及一些特殊场合的限制,使用语音识别这种自然的人机接口技术愈发显得迫切。基于HMM架构的语音识别技术经过几十年的发展,在实验室环境下已经取得了很高的识别率。当前已经取得的技术要想走向实用化,所面临的最大障碍来自于语音识别前端的鲁棒性问题。本文对语音识别的前端鲁棒性问题做了比较深入细致的分析,并在此基础上比较全面地介绍了解决这些棘手问题所采取的一些措施。文章最后对语音识别前端鲁棒性问题给出了一定的讨论和展望。 相似文献
16.
17.
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统 总被引:1,自引:0,他引:1
谢磊 I.Cravyse 蒋冬梅 赵荣椿 H.Sahli Werner Verhelst J Cornelis Ignace Lemahieu 《计算机工程与应用》2003,39(16):3-5,35
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。 相似文献
18.
针对MMSE方法语音失真较大的缺点,提出一种将噪声被掩蔽概率引入高分辨率掩蔽感知模型的方法,通过初始噪声序列进行噪声谱的更新,然后计算噪声掩蔽参数,适时更新数据参数以动态确定每一帧的权值,实验结果表明,该方法在有效抑制背景噪声的同时还降低了音乐噪声,在语音降噪方面实现了比MMSE方法更好的增强效果. 相似文献
19.
该文阐述了语音信号的特点,语音识别过程及技术,重点讨论了例谱技术及其在语音信号特征提取中的应用,并将自组织映射神经网络应用到语音识别中,提出了网络模型。 相似文献
20.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。 相似文献