期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

章雒霏张铭李晨《电子与信息学报》2016,38(8):2020-2026

针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。相似文献

2.

语音增强用于坦克驾驶舱内无线语音通信

张睿高勇《电子工程师》2006,32(4):5-7,10

讨论了一种基于传统谱相减算法的改进方法。利用语音的短时平稳性,通过先验幅度比来连续更新噪声谱的估计,从而代替复杂的VAD(话音活性检测)。计算机仿真结果表明,这种改进方法有效抑制了噪声干扰,语音得到了增强,在极大地提高信噪比的同时,将残留的音乐噪声和语音失真保持在人耳听觉容忍的范围以内,从而较好的保持了语音自然度。相似文献

3.

采用子带长时信号变化特征的稳健语音活动检测

蔡铁唐飞龙志军《电视技术》2014,38(19)

为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率. 相似文献

4.

支持向量机在语音激活检测中的应用研究 总被引：7，自引：0，他引：7

董恩清赵鹤鸣周亚同张晓娣《通信学报》2003,24(3):70-77

提出将支持向量机(SVM)方法应用于语音激活检测(VAD),并验证SVM方法在VAD检测中的有效性。采用了快速训练支持向量机的序列最小最优化方法(SMO)进行训练。提出的基于SVM的VAD方法仍然采用G.729附件B(G.729B)中的VAD方法所采用的特征参数作为分类的特征参数。经过基于SVM的VAD方法与G.729B的VAD方法进行比较,表明SVM方法应用于VAD中是有效的。相似文献

5.

一种基于归一化峰度的抗非高斯噪声语音VAD检测方法

张奕殷福亮《信号处理》2009,25(10)

在多媒体会议房间中,鼓掌、咳嗽等非高斯干扰噪声常会严重影响语音处理系统的性能.为了有效地抑制非高斯干扰噪声,本文提出了一种基于线性预测残差域高阶统计量的语音VAD检测方法.该方法利用语音信号线性预测残差的归一化峰度表征语音和非语音信号在谐波数量上的差异,构造判别准则进行VAD检测,并通过预估高斯背景噪声的能量,削弱了背景噪声对VAD算法性能的影响.仿真实验结果表明,该方法能够有效地区分高斯背景噪声下的语音和非高斯噪声. 相似文献

6.

一种具有鲁棒性的语音激活检测方法

齐峰岩鲍长春《信号处理》2005,21(Z1):172-175

本文提出了一种对于不同背景噪音具有鲁棒性的语音激活检测(VAD)算法.首先,该算法基于统计模型理论、线性预测原理以及自适应时变噪声参数估计方法,在时域和频域中共提取了四个特点不同的特征参数作为分类器的输入特征矢量,然后应用支持向量机(SVM)的方法,进行语音激活检测.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的检测性能要优于ITU G.729B中的VAD算法. 相似文献

7.

一种基于MMSE-LSA和VAD的语音增强算法

晏光华《移动通信》2014,(10):59-62,66

通过介绍语音增强的特点,详细分析了最小均方误差对数谱幅度估计(MMSE-LSA)算法,并提出了与MMSELSA算法相匹配的语音激活检测(VAD)算法。该方案计算简单、易于实现且语音增强效果好,能够动态地跟踪背景噪声的变化。最后通过仿真分析,比较了MMSE-LSA与其它几种语音增强算法的增强效果。相似文献

8.

噪声估计和谱熵结合的语音激活检测算法

郑秋菊李强王岑《现代电信科技》2013,(12):36-40

本文提出一种语音激活检测的改进算法。首先在传统噪声估计的基础上,用Bark子带代替了DFr频域变换,目的在于降低计算复杂度;其次将估计的噪声谱进行白化滤波,并运用于子带谱熵算法中的谱熵计算中。把谱熵值作为VAD算法提取的特征参数,通过门限设定与比较,得出最初的VAD判决结果。增加拖尾延迟保护机制得出最终的VAD判决结果。相似文献

9.

基于短时对数谱估计MMSE的语音增强算法研究

袁伟军刘珩《电声技术》2007,31(10):59-62,65

结合语音激活检测(VAD)技术对短时对数谱估计最小均方误差(LSA-MMSE)语音增强算法进行了改进。通过实验表明,LSA-MMSE增强算法在消除背景噪声、增加语音清晰度和提高语音自然度等方面比谱减法更加有效。相似文献

10.

利用语音VAD和DTX增强Abis接口传输能力的可能性探讨

傅永根陈慧剑《南京邮电学院学报(自然科学版)》2003,23(1):38-42

提出了一种提高目前GSM系统中Abis接口线路传输能力的方法-利用语音通信的VAD和DTX进行话疸的倍增复用，并对其原理、实现方法、传输性能和影响进行了较为深入的探讨。相似文献

11.

一种基于支持向量机的含噪语音的清/浊/静音分类的新方法 总被引：10，自引：3，他引：7

齐峰岩鲍长春《电子学报》2006,34(4):605-611

本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法. 相似文献

12.

Enhanced Speech Based Jointly Statistical Probability Distribution Function for Voice Activity Detection

LI Jie YOU Datao 《电子学报:英文版》2017,26(2)

Most of Voice activity detection (VAD) methods are based on statistical model. In these meth-ods, the noise signal is always assumed to satisfy and characterized by Gaussian distribution, while the assump-tion of noise does not always hold in practice and which causes that these kinds of method fail to distinguish speech from noise at low Signal-noise-ratio (SNR) level in non-stationary noise condition. For going further to improve the robustness of VAD, a enhanced speech based method is proposed. In the proposed method, the Laplacian distri-bution is used to model the remained noise since we find that the remained noise in enhanced speech satisfy Lapla-cian distribution; in addition, Gaussian mixture model is used to characterize the Discrete Fourier transform (DFT) coefficients of reconstructed speech in enhanced speech. Experimental results show that the proposed method per-forms better than the baseline method, especially in low SNR and non-stationary noise conditions. 相似文献

13.

Design of complex-coefficient variable digital filters using successive vector-array decomposition

Tian-Bo Deng 《IEEE transactions on circuits and systems. I, Regular papers》2005,52(5):932-942

Singular-value decomposition (SVD) can be efficiently utilized to obtain the optimal vector-array decomposition (VAD) for simplifying real-coefficient variable digital filter design problem, but the SVD-based VAD methods are not applicable to the design of complex-coefficient variable filters. This paper proposes a successive algorithm for decomposing arbitrary multidimensional complex array into the VAD form, and thus, a complex-coefficient variable digital filter with arbitrary variable frequency response can be easily obtained through constant complex-coefficient filter design and multidimensional polynomial fitting. The new VAD algorithm successively decomposes the complex array and its residual arrays into the vector-array pairs stage by stage, and each stage contains an iterative optimization that can be easily solved in a closed-form. Our computer simulations have demonstrated that the successive VAD converges very fast to the optimal solution. 相似文献

14.

基于竞争网络的语音激活检测研究

柳燕鲍长春《信号处理》2006,22(1):57-60

本文提出了一种新的语音激活检测算法,这种方法基于竞争神经网络,主要应用了自组织特征映射网络并结合学习向量量化算法进行实现,并与其它神经网络算法进行了比较。该算法在多种噪声背景下具有较强的鲁棒性,仿真结果表明,这种基于竞争神经网络的算法优于ITU—T G．729B建议的算法。相似文献

15.

融合统计模型与EMD的宽带话音增强方法

周璇鲍长春夏丙寅《通信学报》2013,34(8):13-101

提出了一种融合统计模型和经验模态分解(EMD)的宽带话音增强方法。该方法首先用统计模型增强算法消除含噪话音中的主要噪声成分,然后用一种基于活动话音检测(VAD)的EMD增强算法做后处理进一步抑制残留噪声,从而使以上2种方法的优点有效地结合。在ITU-T G.160标准下对算法进行了性能测试,测试结果表明,与经典的统计模型方法相比,在不同强度的背景噪声下,增强话音的信噪比提高都较为明显。同时,在低信噪比情况下,该方法能有效抑制增强话音高频部分的音乐噪声,提高了听觉舒适度。相似文献

16.

基于盲源分离理论的麦克风阵列信号有音/无音检测方法 总被引：1，自引：0，他引：1

马晓红梁丽丽殷福亮《电子与信息学报》2007,29(3):589-592

该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源信号。对分离出的语音源信号进行有音/无音检测,获得VAD结果,同时估计出各个麦克风信号相对于该信号的时延值。以相对纯净语音源信号的VAD检测结果为参考,将其分别平移相应的时延值,即可同时获得多路麦克风信号的VAD结果。计算机模拟结果表明,在方向性噪声场的多种情况下,该方法对具有加性噪声的多路麦克风信号均具有较好的有音/无音检测能力。相似文献

17.

Robust Voice Activity Detection Based on Concept of Modulation Transfer Function in Noisy Reverberant Environments

Shota Morita Masashi Unoki Xugang Lu Masato Akagi 《Journal of Signal Processing Systems》2016,82(2):163-173

Voice activity detection (VAD) is used to detect speech and non-speech periods from observed speech signals. It is an important front-end technique for many speech technology applications. Many VAD methods have been proposed. However most of them have been applied under clean or noisy conditions. Only a few methods have been proposed for reverberant conditions, particularly under noisy reverberant conditions. We therefore need to understand the ill effects of noise and reverberation on speech to design an accurate and robust method of VAD under noisy reverberant conditions. The ill effects of noise and reverberation for speech can be regarded as the modulation transfer function (MTF) under noisy and reverberant conditions. Therefore, our study is based on the MTF concept to reduce the ill effects of noise and reverberation on speech, and propose a robust VAD method that we obtained in this study. Noise reduction and dereverberation were first applied to the temporal power envelope of the speech signal to restore the temporal power envelope with this method. Then, power thresholding as a VAD decision was designed based on the restored temporal power envelope. A method of estimating the signal to noise ratio (SNR) was proposed to accurately estimate the SNR in the noise reduction stage. Experiments under both artificial and realistic noisy reverberant conditions were carried out to evaluate the performance of the proposed method of VAD and it was compared with conventional VAD methods. The results revealed that the proposed method significantly outperformed the conventional methods under artificial and realistic noisy reverberant conditions. 相似文献