共查询到18条相似文献,搜索用时 140 毫秒
1.
2.
语音端点检测是语音识别系统的一个重要组成部分,特别是在噪声环境下,其准确性直接影响到语音识别系统的计算复杂度和识别性能。提出了一种在噪声环境下基于短时TEO能量的语音信号端点检测方法,采用了双门限-三态转换判决机制以保证算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明,与传统的短时能量法和谱熵法相比,该算法在低信噪比情况下具有更好的端点检测能力,显示了算法的优越性。 相似文献
3.
4.
5.
6.
林雪梅 《计算机工程与科学》2011,33(1):94-96
本文在分析基于短时能量的语音端点检测算法局限的基础上,引入短时信噪比SNR估计方法,并设计自适应的判决门限,提出一种自适应语音端点检测算法.通过对平稳高斯白噪声环境下信噪比从-10dB到20dB的带噪语音信号进行的仿真实验表明,所提方法能更为准确地检测到语音的端点. 相似文献
7.
通过计算语音频谱上谐波基频能量,在频域上检测浊音信号。因谐波频谱是乐音的基本特征,所以这种算法可以有效地消除各种非乐音噪音信号的影响,具有较高灵敏度和准确性。根据检测到的浊音位置和基频值,利用语音信号时域短时平稳特性,在时域上应用互相关系数确定相邻基音节,进而精确检测浊音信号的起始和终止端点。根据清音频率较高的特点,先对语音信号通过二阶微分提升高频能量。应用Teager能量算子可以同时分析能量和频率变化的特点检测纯净语音信号中清音的起始和终止端点。实验研究结果表明语音端点检测算法具有较高的可靠性和精确性。 相似文献
8.
《计算机应用与软件》2016,(2)
针对车载环境下语音系统受到外界强噪声的干扰而导致识别精度降低以及通信质量受损的问题,提出一种自适应MMSE-LSA估计与TEO(Teager Energy Operator)能量端点检测相结合的语音增强算法。TEO端点检测可以将语音分为语音段和非语音段,从而在噪声估计时可以更好地跟踪噪声的变化,得到更加准确的先后验信噪比,使增强后的语音最大限度地接近纯净语音,而且对车载噪声的增强效果比其他噪声更好。在车载环境中进行实验,结果显示该方法与MMSE-LSA以及传统的谱减法相比,提高了输出信噪比,减弱了音乐噪声,在可懂度和清晰度方面均具有优势。 相似文献
9.
10.
为了提高语音端点检测算法的鲁棒性,提出了一种在不同信噪比下采用不同语音特征参数的端点检测算法.对含噪语音进行基于背景噪声能量估计的信噪比估计,根据估计的信噪比大小选择不同的特征参数来进行端点检测,在高信噪比下采用传统的语音短时能量和过零率,在低信噪比下采用基音周期、高频与全频带能量比和谱失真,即算法能根据信噪比的大小来自适应调整检测方法.实验结果表明,该方法具有良好的鲁棒性,在不同的信噪比下检测的准确率都很高. 相似文献
11.
提出基于短时能量和过零率的简化语音信号双门限端点检测算法,搭建Matlab的算法仿真平台,实验结果表明,基于短时能量和过零率的双门限端点检测算法在保证检测率的前提下,运算复杂度和运算量均优于倒谱、分形、加权门限端点检测方法。采用Verilog语言完成了该模块的设计和仿真,并成功应用于孤立词语音识别系统中。该语音识别系统采用定点数设计方式,语音信号的采样频率为8kHz,每次采样的数据为8bits,晶片内部稳定工作频率为20MHz。实验结果表明,在200个词源的条件下,平均可以达到90%以上的识别效果。 相似文献
12.
语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中的准确性。这种方法降低了藏语语音处理的时间、提高了处理的质量、可用来进行一些藏语语音识别的特征参数的提取。 相似文献
13.
14.
15.
语音端点检测在语音处理中占有非常重要的地位,传统的检测方法是基于短时能量和过量率的双门限比较法,但是在信噪比较低的情况下,利用短时能量和过量率很难得到准确的检测结果。另外,在双门限比较法中,判别门限的取值对整个端点的检测影响很大,而这个门限值往往是靠经验所得,具有不稳定性。因此,针对传统方法的不足,根据语音帧间相关性,提出了一种改进算法。让语音信号通过双门限比较,完成端点检测的一级粗判,在语音起止点的模糊帧段,取一定范围的信号矢量,让这些矢量经过处理后再通过有限状态矢量量化器(FSVQ),得到量化矢量,再对量化矢量进行二级细判,从而得到准确的语音起止点。将改进算法应用于汉语连续数字语音识别,平均识别时间由原来的0.871s缩短为0.719s,平均识别率由原来的81.47%上升至89.13%,实验结果表明了该算法的有效性。 相似文献
16.
为了提高低信噪比环境下语音增强的效果、算法的鲁棒性.在基于维纳滤波算法的基础上,结合基于频域特征的语音端点检查算法,提出了一种新的语音增强算法.端点检测算法使用小波包ERB子带的谱熵和改进的频域能量的能熵比法.其中,小波包ERB子带的谱熵考虑了人耳听觉掩蔽模型和语音与噪声信号之间的频率分布之间的不同;频域能量利用了有语音帧和无语音帧的能量不同.维纳滤波算法实时采集语音数据并使用新的参数来区别无语音段和有语音段,并在无语音段平滑更新噪声谱.实验结果表明,该端点检测算法能够很好的区分有语音段和无语音段,这就使得在低信噪比的情况下语音增强效果得到了提升,同时算法的鲁棒性和实时性也得到了保障.在与其他两种算法对比中,得到了更好的语音增强效果. 相似文献
17.
基于临界频带及能量熵的语音端点检测 总被引:1,自引:0,他引:1
语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并结合各频带内信号的能量熵值在语音段和噪声段的不同分布,实现不同背景噪声下语音端点检测。实验结果表明,提出的语音端点检测算法与传统的短时能量法相比,检测正确率平均高1.6个百分点。所提方法在不同噪声的低信噪比(SNR)环境下均能实现语音端点检测。 相似文献