首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
齐峰岩  鲍长春 《电子学报》2006,34(4):605-611
本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法.  相似文献   

2.
支持向量机在语音激活检测中的应用研究   总被引:7,自引:0,他引:7  
提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参数作为分类的特征参数。经过基于SVM的VAD方法与G.729B的VAD方法进行比较,表明SVM方法应用于VAD中是有效的。  相似文献   

3.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。  相似文献   

4.
晏光华 《移动通信》2014,(10):59-62,66
通过介绍语音增强的特点,详细分析了最小均方误差对数谱幅度估计(MMSE-LSA)算法,并提出了与MMSELSA算法相匹配的语音激活检测(VAD)算法。该方案计算简单、易于实现且语音增强效果好,能够动态地跟踪背景噪声的变化。最后通过仿真分析,比较了MMSE-LSA与其它几种语音增强算法的增强效果。  相似文献   

5.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

6.
袁伟军  刘珩 《电声技术》2007,31(10):59-62,65
结合语音激活检测(VAD)技术对短时对数谱估计最小均方误差(LSA-MMSE)语音增强算法进行了改进。通过实验表明,LSA-MMSE增强算法在消除背景噪声、增加语音清晰度和提高语音自然度等方面比谱减法更加有效。  相似文献   

7.
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,该文提出一种基于子带双特征的自适应保留似然比鲁棒语音激活检测算法。算法采用子带归一化最大自相关函数与子带归一化平均过零率双重特征设置频率分量似然比的保留权值,同时利用已过去固定时长的VAD判决结果及对应的子带特征参数自适应地估计似然比的保留阈值。实验结果表明,此算法的VAD检测准确率相比原保留似然比算法在10 dB, 0 dB和-10 dB平稳白噪声下分别提高了1.2%, 7.2%和8.1%,在10 dB和0 dB非平稳Babble噪声下分别提高了1.6%和3.4%。当其被用于2.4 kbps低速率声码器系统时,合成语音的感知语音质量评价(PESQ)比原声码器系统在白噪声下提高了0.098~0.153,在Babble噪声下提高了0.157~0.186。  相似文献   

8.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法。将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决。实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性。应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率。  相似文献   

9.
在多媒体会议房间中,鼓掌、咳嗽等非高斯干扰噪声常会严重影响语音处理系统的性能.为了有效地抑制非高斯干扰噪声,本文提出了一种基于线性预测残差域高阶统计量的语音VAD检测方法.该方法利用语音信号线性预测残差的归一化峰度表征语音和非语音信号在谐波数量上的差异,构造判别准则进行VAD检测,并通过预估高斯背景噪声的能量,削弱了背景噪声对VAD算法性能的影响.仿真实验结果表明,该方法能够有效地区分高斯背景噪声下的语音和非高斯噪声.  相似文献   

10.
本文提出一种语音激活检测的改进算法。首先在传统噪声估计的基础上,用Bark子带代替了DFr频域变换,目的在于降低计算复杂度;其次将估计的噪声谱进行白化滤波,并运用于子带谱熵算法中的谱熵计算中。把谱熵值作为VAD算法提取的特征参数,通过门限设定与比较,得出最初的VAD判决结果。增加拖尾延迟保护机制得出最终的VAD判决结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号