首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
周祜旸  刘戈  方向忠 《信息技术》2023,(8):94-100+106
随着语音技术的发展,越来越多语音处理系统尝试应用于现实生活。然而在实际场景中,噪声干扰是一个影响语音识别等任务准确率的重要因素。为了克服噪声问题并提升性能,需设计语音分离或增强模块。文中通过结合波束成形与神经网络设计了在毫米半径麦克风阵列场景下的语音分离系统并在语音识别任务上进行了测试。实验显示文中设计的系统对语音识别准确率有一定帮助。该方法可以应用于设备空间受限的场景中以提高性能。  相似文献   

2.
基于改进语音特征提取方法的语音识别   总被引:1,自引:1,他引:0  
在分析语音特征提取方法基础上提出一种改进组合算法,并采用HMM声学模型和Viterbi算法进行模式训练和识别.实验结果表明,该算法在噪声环境中具有较好的鲁棒性,能有效提高噪声环境下中文连续语音识别的正确率,增强语音识别整体性能,因此在噪声环境下的语音识别系统中具有一定的实用价值.  相似文献   

3.
语音控制是智能化设备的重要控制手段,而语音识别是实现语音控制的关键技术。为了设计一种可靠的、抗干扰性强的产品,提出了一种基于双麦克风降噪技术的语音识别系统。该设计运用ROHM公司的BU8332KV芯片作为语音识别前端处理的核心,利用其双麦克风降噪技术来解决语音识别中的噪声问题,结合单片机和语音识别芯片,应用于按摩椅的语音控制系统中。经过非特定人的语音识别系统的静态和噪声环境下测试,结果表明在噪声环境下,该系统有较高的识别率,适用于按摩椅的应用环境,也适合在其他有环境噪声干扰的语音识别系统中推广应用。  相似文献   

4.
王兴斌  徐望  王炳锡  马治飞 《信号处理》2005,21(Z1):204-207
语音识别中,语音信号能量是一个重要的识别特征参数.在噪声环境下,语音信号能量产生的畸变是导致识别率下降的原因之一.本文依据RASTA-PLP分析的增益参数和最小均方误差估计准则,给出了带噪语音能量和干净语音信号能量的线性映射关系.在中文连续语音识别中的应用表明,利用该映射关系得到的干净语音能量估计,可使信噪比为5dB的白噪声环境下的识别正确率提高21.36%.  相似文献   

5.
鲁棒性语音识别是为了解决噪声环境和混响环境等外界因素所引起的语音识别系统训练和识别不匹配的情况,针对在噪声和混响条件下进行鲁棒性语音识别的问题,对现有的鲁棒性语音识别研究进行了总结,阐述了语音识别的主要流程和整体框架;从特征提取和声学建模两个方面对语音增强技术、语音分离技术进行介绍;分析鲁棒性语音识别技术主要难点和实现过程。最后对鲁棒性语音识别技术进行总结和展望。  相似文献   

6.
全刚  肖熙 《电声技术》2010,34(6):45-47
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。  相似文献   

7.
马治飞  徐望  王炳锡  王兴斌 《信号处理》2005,21(Z1):192-195
本文详细给出了概率模型中引入倒谱预测值的动态相关性来进行特征补偿的方法.该方法采用期望最大化(EM)算法来估计联合分布参数,基于语音和噪声的先验概率密度、在倒谱域对语音特征参数进行最小均方误差预测(MMSE),以提高语音识别精度.不同噪声环境和不同信噪比下的实验结果表明,本文方法能有效提高噪声环境下的中文连续语音识别的正确率.  相似文献   

8.
作为语音处理领域的支撑技术之一,语音识别以识别语音信号并将其转变成文字为目标,在智能人机交互、对话系统、多媒体内容分析等领域有着广阔的应用前景。经过数十年的发展,目前的语音识别技术在理想状况下能取得较高的识别率。然而,在采集和传输过程中,语音信号不可避免地会受到各种信道和加性噪声的干扰,引起训练环境和识别环境不一致、即环境失配,进而导致识别系统的性能急剧下降。这种失配严重阻碍了语音识别技术走向现实应用,已成为语音识别领域中迫切需要解决的问题之一。首先阐述了环境失配的问题,然后按照加性噪声、信道畸变和联合补偿的脉络,系统地综述了各个问题的补偿方法。  相似文献   

9.
针对语音识别实际应用过程中的噪声问题,给出了一种新的抗噪声的特征提取算法,即先利用小波变换将语音信号进行小波子带分解,再根据人耳的听觉掩蔽效应,由谱压缩的技术,将小波变换后的子带语音信号进行压缩,从而提取其对应的语音特征。通过MATLAB软件建立实验平台,仿真实验结果表明该语音特征可以在噪声环境下得到较高的识别率。新的特征参数即充分利用了小波的抗噪声特性又有效地降低了语音识别中的训练环境和识别环境间的失配,具有抗噪声的特点。  相似文献   

10.
基于小波变换的鲁棒型特征提取及说话人识别   总被引:4,自引:0,他引:4  
说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。  相似文献   

11.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

12.
噪声环境下说话人识别的组合特征提取方法   总被引:1,自引:0,他引:1  
芮贤义  俞一彪 《信号处理》2006,22(5):673-677
针对在干净语音环境下识别率很高的说话人识别系统,在噪声环境下识别率显著降低的缺点,本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的组合特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在噪声环境下进行的识别实验结果表明,本文提出的组合特征提取算法可以在噪声环境下有效地提高说话人识别系统的识别性能。  相似文献   

13.
讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。  相似文献   

14.
主要讨论了情感语音特征参数的提取、语音情感的分类、语音资料的获取和应用连续隐马可夫模型进行情感识别等,重点比较了ZCPA特征参数和传统特征参数在不同噪声环境下的识别率,实验表明,在不同的噪声环境下,采用ZCPA特征的语音情感的识别效果较好,识别率也没有明显的下降。  相似文献   

15.
高阶MFCC的话者识别性能及其噪声鲁棒性   总被引:6,自引:0,他引:6  
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量.本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性.基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量.实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性.  相似文献   

16.
基于谱减的Robust电话语音识别方法   总被引:1,自引:0,他引:1  
谱减技术是语音增强的有效方法,并被成功地应用到了车辆等环境下的Robust语音识别中。文章对将谱减技术应用到电话语音识别中的加性噪声去除上进行了尝试。实验验证该方法有利于改进电话语音识别的性能,对不特定话音84个孤立词的实验,误识率下降了21.8%。  相似文献   

17.
王蕾  张友纯 《信息技术》2006,30(3):37-39
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能简化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较,以达到话者识别的目的。  相似文献   

18.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

19.
陈慧  芮贤义 《电声技术》2016,40(8):36-39
在VC++的编程环境下设计了一个小词汇量孤立词非特定人的汽车语音识别系统,系统中的识别词汇都是汽车驾驶员在驾驶过程中可能做的一些手控操作.语音预处理采用的是改进后的端点检测算法.实验分析时,在测试数据中加入噪声库(NoiseX-92)中的车内噪声来模拟汽车驾驶环境,并提出随机映射梅尔频率倒谱系数来增强噪声环境下系统的鲁棒性.测试数据表明,使用随机映射特征参数使得系统的抗噪声能力得到了很大的提升.  相似文献   

20.
并行子带HMM最大后验概率自适应非线性类估计算法   总被引:1,自引:0,他引:1  
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号