期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

雷建军杨震刘刚郭军《计算机应用研究》2009,26(4):1210-1216

针对噪声环境下的语音识别问题,对现有的噪声鲁棒语音识别技术进行讨论,阐述了噪声鲁棒语音识别研究的主要问题,并根据语音识别系统的构成将噪声鲁棒语音识别技术按照信号空间、特征空间和模型空间进行分类总结,分析了各种鲁棒语音识别技术的特点、实现,以及在语音识别中的应用。最后展望了进一步的研究方向。相似文献

2.

一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法 总被引：1，自引：0，他引：1

王振力裴凌波于元斌《智能系统学报》2008,3(6)

提出一种基于语音增强算法的噪声鲁棒语音识别方法．在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比．然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声．实验结果表明,在低信噪比（-12—0 dB）条件下,该方法对于数字语音识别具有较好的识别率,其性能明显优于基本的Mel频段倒谱参数识别器、传统的谱减法和噪声对消语音增强法．相似文献

3.

基于子带信息的鲁棒语音特征提取框架 总被引：2，自引：1，他引：2

张欣研王帆郑方徐明星吴文虎《中文信息学报》2002,16(1):20-25

本文提出一种鲁棒语音特征提取框架。通过使用一种基于子带能量分布的噪声估计方法,无需静音段,就可以估计出带噪语音的子带噪声,同时提出结合谱减和谱加权方法对特征进行处理,最终生成具有较高鲁棒性的特征。实验证明,在语音识别系统中,这种特征可以有效提高语音识别的鲁棒性,在噪声较强(信噪比0dB到15dB)的情况下,识别率可以提高20%以上;并且,在干净语音的情况下又能保证识别率没有大的下降;同时,这种特征上的处理方法对各种噪声的适应能力都很强,无需对噪声进行预先分类即可得到很好的抗噪效果。相似文献

4.

基于贝叶斯方法的鲁棒语音切分 总被引：1，自引：0，他引：1

张文军谢剑英李聪《数据采集与处理》2002,17(3):260-264

在基于隐马尔科夫模型的语音切分基础上，融合了不受噪声干扰的先验切分模型，提出了基于贝叶斯方法的语间切分方法。在贝叶斯切分方法的框架内，作者首先对语音序列进行了变换，将由切分点构成的序列变为由音节长度构成的序列。然后，假设音节长度序列符合一阶马尔科夫过程，经过归一化处理后，求出了切分的先验概率公式，得到了贝叶斯方法的切分模型。在噪声环境下的实验证明，由于切分模型独立于噪声，对在噪声环境下声学模型的失配提供了很好的补偿，使得语音切分的鲁棒性大大增加。相似文献

5.

基于相对自相关序列MFCC特征的丢失数据带噪语音识别方法 总被引：1，自引：0，他引：1

张军韦岗熊燕《模式识别与人工智能》2005,18(1)

提出了一种基于相对自相关序列(Relative Autocorrelation Sequences,RAS)MFCC(Mel-Frequency Cepstral Coefficient)特征的丢失数据带噪语音识别新方法.首先分析了环境噪声对RAS-MFCC的影响,提出了一种基于掩盖原理的不可靠分量检测方法;然后采用丢失数据(Missing data,MD)技术来消除畸变分量对识别过程的影响.实验结果表明,本文所提的识别方法可以在不同类型和信噪比的噪声环境中有效提高RAS-MFCC的识别率,并且其性能优于典型的基于滤波器组(Filter bank)语音特征的丢失数据语音识别方法. 相似文献

6.

基于特征参数归一化的鲁棒语音识别方法综述

肖云鹏叶卫平《中文信息学报》2010,24(5):106-117

目前,自动语音识别系统往往会因为环境中复杂因素的影响,造成训练环境和测试环境存在不匹配现象,使得识别系统性能大幅度下降,极大地限制了语音识别技术的应用范围。近年来,很多鲁棒语音识别技术成功地被提出,这些技术的目标都是相同的,主要是提高系统的鲁棒性,进而提高识别率。其中,基于特征的归一化技术简单而有效,常常被作为鲁棒语音识别的首选方法,它主要是通过对特征向量的统计属性、累积密度函数或功率谱的归一化来补偿环境不匹配产生的影响。该文主要对目前主流的归一化方法进行介绍,其中包括倒谱矩归一化方法、直方图均衡化方法以及调频谱归一化方法等。相似文献

7.

基于噪声鲁棒对比损失的图像去噪

朱华胡晓禹《电脑编程技巧与维护》2023,(3):149-151

针对图像复原过程中，观测图像由于成像偏差，环境系统随机噪声等原因造成的偏差问题，在进行特征提取时，采用深度学习获取图像的语义特征信息，从而更好地获取图像的语义边缘信息。进行数据标注时，为了规避传统标注的不准确的情况，在不利用标签信息的情况下，为减轻甚至消除由于随机采样导致的假阴性样本对（FNP），提出了一种噪声鲁棒的对比损失函数，该函数可自适应地防止FNP给网络优化带来的消极影响。通过实验验证了方法的有效性。相似文献

8.

基于邻接空间的鲁棒语音识别方法

严斌峰朱小燕张智江张范《软件学报》2007,18(4):878-883

提出了一种基于邻接空间模型的鲁棒语音识别方法,解决测试集和训练集差别导致的识别正确率过低的问题.在以声学模型为中心的邻接空间中计算贝叶斯预测概率密度值,作为观察概率输出分值进行识别.实验表明,相对于传统语音识别方法,鲁棒识别方法在保证干净测试集的识别率没有很大下降的前提下,对含噪测试集的识别率获得了较大的提高. 相似文献

9.

一种基于听觉模型的语音特征提取方法 总被引：2，自引：0，他引：2

李鸣华《计算机与现代化》2000,(3):9-13

提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。相似文献

10.

基于观测器的鲁棒模型预测控制算法 总被引：2，自引：0，他引：2

王伟杨建军吕博《控制与决策》2001,16(5):557-560

对于含有未建模动态的输入受限离散时间线性系统,当系统状态不可测时,提出一种基于状态观测器的鲁棒模型预测控制算法。该算法采用双模型控制结构,将不变椭圆集同时应用于估计状态方程和误差方程,保证算法的稳定性和可行性,并同时给出系统稳定和可行的条件。相似文献

11.

基于语音增强失真补偿的抗噪声语音识别技术 总被引：1，自引：0，他引：1

丁沛曹志刚《中文信息学报》2004,18(5):65-70

本文提出了一种基于语音增强失真补偿的抗噪声语音识别算法。在前端,语音增强有效地抑制背景噪声;语音增强带来的频谱失真和剩余噪声是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿。实验结果表明,此算法能够在非常宽的信噪比范围内显著的提高语音识别系统在噪声环境下的识别精度,在低信噪比情况下的效果尤其明显,如对-5dB的白噪声,相对于基线识别器,该算法可使误识率下降67.4%。相似文献

12.

稳健语音识别技术研究 总被引：4，自引：0，他引：4

姚文冰姚天任韩涛《计算机工程与应用》2002,38(7):69-71

文章在简单叙述稳健语音识别技术产生的背景后,着重介绍了现阶段国内外有关稳健语音识别的主要技术、研究现状及未来发展方向。首先简述了引起语音质量恶化、影响语音识别系统稳健性的干扰源。然后介绍了抗噪语音特征的提取、声学预处理、麦克风阵列及基于人耳的听觉处理等技术路线及发展现状。最后讨论了稳健语音识别技术未来的发展方向。相似文献

13.

基于差分过零峰值幅度特征的抗噪语音识别

任月平张大海张雪英《电脑开发与应用》2006,19(8):2-3,6

针对多数语音识别系统在噪音环境下性能急剧下降的问题,提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过组合语音信号和其差分信号的上升过零率获得频率信息,通过峰值检测和非线性幅度加权来获取强度信息,二者组合在一起,得到输出语音特征,再分别用BP神经网络和HMM进行训练和识别。仿真实现了不同信噪比下不依赖人的50词的语音识别,给出了识别的结果,证明了组合差分信息的过零与峰值幅度特征具有较强的抗噪声性能。相似文献

14.

语音识别中谱包自相关技术 总被引：1，自引：0，他引：1

徐静波于洪涛冉崇森《数据采集与处理》2004,19(4):421-424

提出了一种语音识别线性预测分析方法：基于谱自相关和频率抽样获得谱包，即由归一化频率估计谱包，此谱包规定在Mel频率级；再由语音信号谱包估计抽样自相关，用IDFT提取抽样自相关估计。从抽样自相关的结果，最终获得谱包倒谱系数。HMM识别试验显示：谱包倒谱系数与其他算法相比较，在低信噪比时，识别率可提高10％以上，识别性能明显提高，在噪声环境下也能达到好的识别效果。相似文献

15.

语音识别中动态时间规整和隐马尔可夫统一模型 总被引：1，自引：0，他引：1

张焱张杰《数据采集与处理》1997,12(3):218-222

对于目前在语音识别中广泛使用的两种技术即动态时间规整（ＤＴＷ）技术和隐马尔可夫模型（ＨＭＭ）的本质联系，提出了二者的统一模型（ＤＨＵＭ，ＤＴＷａｎｄＨＭＭＵｎｉ－ｆｉｅｄＭｏｄｅｌ），并分别给出ＤＴＷ和ＨＭ向ＤＨＵＭ的转换关系。文中还提出了用ＤＨＵＭ解决更接近语音实际情况的高阶ＨＭＭ作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明，建立在ＤＨＵＭ之上的识别器的识别性能不低于相似文献

16.

基于计算听觉场景分析和语者模型信息的语音识别鲁棒前端研究 总被引：1，自引：0，他引：1

关勇李鹏刘文举徐波《自动化学报》2009,35(4):410-416

传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition, ASR)系统的鲁棒性问题. 本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis, CASA)和语者模型信息的混合语音分离系统. 该系统在CASA框架下, 利用语者模型信息和因子最大矢量量化(Factorial-max vector quantization, MAXVQ)方法进行实值掩码估计, 实现了两语者混合语音中有效地分离出目标说话人语音的目标, 从而为ASR系统提供了鲁棒的识别前端. 在语音分离挑战(Speech separation challenge, SSC)数据集上的评估表明, 相比基线系统, 本文所提出的系统的语音识别正确率提高了15.68%. 相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性. 相似文献

17.

基于循环神经网络的语音识别模型 总被引：4，自引：1，他引：4

朱小燕王昱徐伟《计算机学报》2001,24(2):213-218

近年来基于隐马尔可夫模型（HMM）的语音识别技术得到了很大发展。然而HMM模型有着一定的局限性,如何克服HMM的一阶假设和独立性假设带来的问题一直是研究讨论的热点,在语音识别中引入神经网络的方法是克服HMM局限性的一条途径。该文将循环神经网络应用于汉语语音识别,修改了原网络模型并提出了相应的训练方法,实验结果表明该模型具有良好的连续信号处理性能,与传统的HMM模型效果相当,新的训练策略能够在提高训练速度的同时,使得模型分类性能有明显提高。相似文献

18.

语音线性预测技术新探

下载免费PDF全文

徐静波冉崇森《计算机工程与科学》2004,26(5):93-95

本文提出了一种线性预测分析方法。通过估计频率抽样获得谱包,由归一化频率估计谱包;谱包规定在mel频率级,由IDFT提取抽样自相关估计,我们从抽样自相关的结果最终获得谱包cepstral系数(SEC)。HMM(Hidden Markov Model)识别实验表明,SEC与其它算法相比较,在低信噪比时,识别性能明显提高。相似文献

19.

基于语言模型的调度语音智能识别研究

杜凡张敏单祖植杨再鹤《单片机与嵌入式系统应用》2022,22(2):55-59

针对调度语音识别过程中单遍解码词图生成算法所生成词图精度较差的问题,研究基于语言模型的调度语音智能识别方法。构建由训练过程和识别过程组成的调度语音智能识别模型,训练过程中该模型提取语音数据的语音向量序列构建声学子模型,利用语言子模型训练文本数据构建语音词图,识别过程中对声学子模型、语音词图以及发音词典实施语音解码与搜索获取最优词序列,基于最优词序列完成调度语音智能识别。测试结果显示研究方法所生成的词图精度较高,可准确识别调度语音。相似文献