共查询到19条相似文献,搜索用时 315 毫秒
1.
基于双门限两级判决的语音端点检测方法 总被引:1,自引:0,他引:1
端点检测是语音信号处理过程中的重要步骤,其准确性直接影响语音信号处理的速度和结果。因此对于端点检测方法,特别是在噪声环境下的端点检测研究,一直是语音信号处理中的热点。文中针对声纹识别系统所作的端点检测前端处理,对比了利用短时能量和短时平均过零率进行端点检测的方法,运用Matlab实现了双门限法端点检测的编程和仿真。仿真结果表明,端点检测准确时识别率为93%。 相似文献
2.
3.
端点检测是语音信号处理中的一个非常重要的步骤,其准确度直接影响语音信号处理的速度和效果。传统的端点检测方法可以在高信噪比环境下准确地检测语音端点,但在低信噪比情况下,传统的端点检测特征参数不能充分描述语音信号的特征,导致端点检测效果的下降。为此,本文提出了一种对语音进行改进的多窗谱减法降噪和中值滤波减少低信噪比环境下无话段的起伏后,在结合对数能量、过零率和自相关函数主副峰比值的端点检测方法,实验表明,该方法比传统的端点检测方法具有更好的精度和鲁棒性,在低信噪比环境下取得了良好的端点检测效果。 相似文献
4.
语音端点检测中能零比方法的改进 总被引:1,自引:0,他引:1
传统的基于语音信号短时能量与短时过零率之比的单参数双门限端点检测方法对高信噪比的语音信号能实现较好的检测,而在低信噪比的情况下检测正确率却很低。本文在研究了语音信号的非线性分析方法后,提出了一种改进的端点检测方法。首先,对分帧加窗后的每一帧带噪语音信号进行经验模态分解求其短时Teager能量;然后,求每一帧的短时过零率,平滑处理之后进行归一化;最后,求出短时Teager能量与归一化短时过零率之比用于端点检测。经过仿真实验证明,本文提出的改进方法能够在低信噪比的带噪环境下实现比传统能零比方法更好的端点检测效果。 相似文献
5.
6.
MFCC是语音识别中常用的特征参数,根据MFCC分量对语音端点的敏感性,提出利用平常舍去的识别特征参数分量MFCC0作为语音端点检测的参量.接着根据MFCC0的特性设计了一种新的端点检测方法,该方法简单且无需增加额外的计算量.实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率. 相似文献
7.
在语音识别系统中产生错误识别的原因之一是端点检测有误差.在高信噪比情况下,正确地确定语音的端点并不困难.然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作.本文利用倒谱特征来检测语音端点,提出了带噪语音端点检测的两个算法,第一个算法利用倒谱距离代替短时能量作为判决的门限,第二个算法改进了基于隐马尔柯夫模型(HMM)的语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测. 相似文献
8.
高脉冲噪声坏境中双门限法语音端点检测研究 总被引:1,自引:0,他引:1
语音端点检测是对有效语音段的识别关键技术,准确的端点检测使语音信号的后续处理计算量减少,有效地节约资源。现在多数语音端点检测技术例如能频值、谱熵、小波能量熵变换等都能准确检测出有效的语音段。文中介绍了一种双门限端点检测法,即利用短时平均过零率和短时平均能量法进行双门限检测,再设置一个最短时间门限,有效地在高脉冲噪声环境中准确识别汉语发音。通过与其他方法对比实验,文中双门限技术在短时高脉冲噪声环境下能有效提高语音识别率。仿真结果表明,端点检测正确率达93%。 相似文献
9.
10.
以Xilinx公司Virtex-II Pro为开发平台,实现了一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的孤立词语音识别系统.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数.实验表明系统在150词条的情况下识别率达到97.3%,识别时间为1.42倍实时. 相似文献
11.
12.
由嵌入式设备所构建的视频会议系统终端,在会话建立后,需要对来自各方的媒体信息诸如语音进行混音处理。在信令集中、媒体流分布的系统中,媒体的混合没有独立出来放在Focus中,而是将与会的各终端发来的语音媒体流在会议参与者主机上实现端混合。在众多混音方案的比对中,这里介绍一种改进的符合语音信号特征的混音架构及溢出处理算法,并用语音信号的短时能量及短时过零率对混音过程进行动态修正。在嵌入式系统的实现验证中表明,该算法提高了混音溢出处理的效率,降低了噪音,具有较低的算法复杂度,并有良好的听觉舒适感。 相似文献
13.
14.
15.
16.
传统的FFT谱分析会产生比较严重的频谱泄漏,应用到语音增强中就会产生严重的音乐噪声.因此使用更加准确的频谱分析将会对整个语音增强系统有很大的改进.将全相位FFT谱分析与最优改进对数谱幅度(OM-LSA)语音估计器结合,提出了新型最优改进对数全相位谱幅度(OM-LapSA)语音估计器,给出了新型语音估计器的流程框图.实验仿真表明,提出的语音估计器增强算法在抑制音乐噪声、提高信噪比和减少语音失真方面要优于传统OM-LSA语音估计器增强算法. 相似文献
17.
系统研究了现有语音通信系统中使用的几种语音编解码算法以及主流的单通道语音增强算法,并将二者相结合,对实际通信系统中的结构进行仿真.研究发现,现有的基于线性预测分析技术的语音编解码算法,在高编码率的情况下对于语音增强算法的性能不仅不会有损失,反而会在一定程度上改善增强算法带来的语音失真的情况,提高语音增强算法的效果. 相似文献
18.
介绍了ITU-G.729语音压缩标准的编、解码原理,提出了一种基于DSP的软、硬件设计方案,并着重讨论了在实现过程中的几项关键技术。 相似文献
19.
首先总结了几种常见的语音活动检测(VAD)方法,然后从计算每帧每个频率点的语音存在概率出发.提出了一种新的VAD方法,并就其中的一些参数选择问题进行了讨论。最后给出新方法与传统方法实验结果对比。 相似文献