首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
噪声环境是语音识别性能下降的原因之一,端点检测作为其关键技术,其性能优劣在某种程度上决定了识别率的高低。提出一种改进的基于倒谱特征的带噪端点检测方法。在传统基于倒谱距离的算法上综合利用短时过零率和短时能量多特征作为最终判决的门限。实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。  相似文献   

2.
一种改进的基于倒谱特征的带噪语音端点检测方法   总被引:3,自引:0,他引:3  
沈红丽  曾毓敏  王鹏 《通信技术》2009,42(2):156-158
环境噪声是语音识别和说话人识别性能下降的原因之一,端点检测作为其关键技术之一,性能优劣在某种程度上决定了识别率的高低。文章提出一种改进的基于倒谱特征的带噪语音端点检测方法。在传统基于倒谱距离的算法基础上,该算法进一步综合利用短时过零率和短时能量作为最终判决的门限。实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。  相似文献   

3.
语音端点检测中能零比方法的改进   总被引:1,自引:0,他引:1  
传统的基于语音信号短时能量与短时过零率之比的单参数双门限端点检测方法对高信噪比的语音信号能实现较好的检测,而在低信噪比的情况下检测正确率却很低。本文在研究了语音信号的非线性分析方法后,提出了一种改进的端点检测方法。首先,对分帧加窗后的每一帧带噪语音信号进行经验模态分解求其短时Teager能量;然后,求每一帧的短时过零率,平滑处理之后进行归一化;最后,求出短时Teager能量与归一化短时过零率之比用于端点检测。经过仿真实验证明,本文提出的改进方法能够在低信噪比的带噪环境下实现比传统能零比方法更好的端点检测效果。  相似文献   

4.
基于倒谱特征的带噪语音端点检测   总被引:44,自引:0,他引:44       下载免费PDF全文
胡光锐  韦晓东 《电子学报》2000,28(10):95-97
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测.  相似文献   

5.
冯国友  戴扬  沈海斌  时晓东 《电子器件》2007,30(3):1098-1101
传统的语音端点检测方法以信号的短时能量、过零率等简单特征作为判决特征参数.这些方法在实际应用中,尤其当信号信噪比比较低时,无法满足系统的需要.文中利用零能积差作为判决采样信号帧是否为语音信号的依据,并通过了硬件来实现.结果表明,该模块较传统方法在保证高识别率的同时,提高了模块的速率,减小了面积,具有一定的实用价值.  相似文献   

6.
基于短时能量比的语音端点检测算法的研究   总被引:1,自引:0,他引:1  
研究了噪声环境下,利用短时高低频能量比进行语音端点检测的问题。在高信噪比的情况下利用传统的双门限判决算法,在低信噪比的情况下采用短时高低频能量比并辅以过零率为特征参数的算法,保证了在高、低信噪比环境下的端点检测的准确性。试验结果表明,与传统的能量阈值法相比,提出的算法具有更好的性能,是一个简单、高效和稳健的语音端点检测算法。  相似文献   

7.
一种低信噪比环境下的语音端点检测方法研究   总被引:1,自引:1,他引:0  
传统的端点检测算法常以短时平均能量、短时平均过零率等特征作为判决参数,但是这些方法在实际应用中,特别是强背景噪声环境下,准确率下降.为此,在利用帧间的倒谱系数距离作为判决方法的基础上,提出改进方法.首先用加权功率谱减法降噪,然后直接计算各帧的倒谱系数相对于原点的距离,再根据预设的判决门限进行判决,降低了因对应系敷异号而导致计算帧间倒谱系数距离时产生误判的可能.实验表明,该算法能在低信噪比环境下有效地检测出语音信号的起始住置.  相似文献   

8.
传统的端点检测算法是基于短时能量和短时过零率的双门限检测法,该算法对于含噪语音信号检测效果不佳.因此,将谱减法与均匀子带频带方差算法相结合,结合算法分两个过程,首先用谱减法对带噪语音信号进行降噪,然后用均匀子带频带方差法进行端点检测.实验结果表明,结合算法对于含噪较多的语音信号检测效果良好.  相似文献   

9.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。  相似文献   

10.
针对短时TEO能量算法抗噪性差的缺点,提出了一种强噪声下的端点检测新算法.该算法在短时TEO能量端点检测的基础上,增加Mel倒谱距离判断环节,采用先粗判后精判的互补性两级判决机制.首先利用强抗噪性Mel倒谱距离进行端点粗判,然后再利用体现语音信号时域特征与语音共振峰特性的短时TEO能量进行端点精判.实验表明,在信噪比相对较低的环境下,该改进算法与传统的双门限法和短时TEO能量相比,在没有增加运算复杂度的同时提高了检测系统的准确度.  相似文献   

11.
变异语音处理的研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
张磊  韩纪庆  王承发 《电子学报》2003,31(3):411-418
本文讨论了变异语音处理技术及其研究进展,分析了变异情况对语音识别性能产生的影响,综述了变异语音分类和变异语音识别方法,探讨了变异语音处理研究中存在的问题及未来的研究重点.  相似文献   

12.
许多高品质语音芯片的音效很好,但常常因为处理的数据量大、信号不便传输,对方便实用的语音系统的开发带来了困难。文中提出一种易于在单片机和高密度可编程器件组成的系统上实现语音处理新方法,较好地完成语音信号的压扩编解码与语音信号的叠加。实践证明这是一种开发多功能语音处理系统中性价比较高的方法。  相似文献   

13.
基于语音信号的情感处理研究进展   总被引:6,自引:0,他引:6  
韩纪庆  邵艳秋 《电声技术》2006,(5):58-62,67
介绍了基于语音信号的情感处理技术的研究进展,综述了该领域的研究方法、相关技术及应用领域,讨论了其未来的发展方向。  相似文献   

14.
Adapted packet speech interpolation (APSI) is presented as an evolution of digital speech interpolation (DSI) techniques. The inherent overload penalties of DSI are mitigated by the use of an overload strategy which distributes the penalties uniformly across all active speech sources. A novel use of linear delta modulation (LDM) allows the system to re-encode the input sources at various rates depending upon the total offered load to the system. The subjective performance of hardware is discussed. Two models of silence and talk-spurt behaviour (called activity) of speech are presented: an analytic model for single speakers obtained by the application of renewal theory, and a simulation model obtained from the analytic model.  相似文献   

15.
 本文研究运用矢量码书和动态内插限制的方法解决语音生成逆向解的非唯一性问题.表征声道的对数截面积函数的限带傅立叶余弦展开包括了偶次项,采用可变声道长度;频域声学目标增加了前N个零点频率;结合腔包形声学——几何形态映射矢量码书,为声学目标匹配得到过渡音的起始和结尾端点的零点与声道长度,并用内插方法来限定过渡点的零点频率和声道长度,从而解决非唯一性问题.计算机仿真实验表明了本方法的有效性.  相似文献   

16.
张煦 《数字通信》1995,22(2):7-9,52
本文扼要介绍音频处理技术的进展,分三部分:(1)语音和音响压缩编码,包括电话语音,立体声音乐和光盘存储;(2)计算机的文本至语音合成;(3)计算机的自动语音识别。  相似文献   

17.
详细介绍了一种基于EBF神经网络的特定人语音识别方法。提出了该语音识别方法在媒体资产管理系统上的应用并给出详细的工作流程图。采用LPC和MFCC2种特征分别建立系统,并对2个系统的识别性能作比较后进行融合。  相似文献   

18.
语音情感识别的研究进展   总被引:10,自引:0,他引:10  
情感在人类的感知、决策等过程扮演着重要角色.长期以来情感智能研究只存在于心理学和认知科学领域,近年来随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算这一研究课题,这将大大的促进计算机技术的发展.情感自动识别是通向情感计算的第一步.语音作为人类最重要的交流媒介,携带着丰富的情感信息.如何从语音中自动识别说话者的情感状态近年来受到各领域研究者的广泛关注.本文从语音情感识别所涉及的几个重要问题出发,包括情感理论及情感分类、情感语音数据库、语音中的情感特征和语音情感识别算法等,介绍了当前的研究进展,并讨论了今后研究的几个关键问题.  相似文献   

19.
叶利剑 《电声技术》2011,35(10):68-74
系统研究了现有语音通信系统中使用的几种语音编解码算法以及主流的单通道语音增强算法,并将二者相结合,对实际通信系统中的结构进行仿真.研究发现,现有的基于线性预测分析技术的语音编解码算法,在高编码率的情况下对于语音增强算法的性能不仅不会有损失,反而会在一定程度上改善增强算法带来的语音失真的情况,提高语音增强算法的效果.  相似文献   

20.
王虹  陈锴 《信息技术》2005,29(7):29-31
介绍了ITU-G.729语音压缩标准的编、解码原理,提出了一种基于DSP的软、硬件设计方案,并着重讨论了在实现过程中的几项关键技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号