首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 267 毫秒
1.
谱减法是语音增强处理中常用的方法。针对应用于单通道语音增强的谱减技术中存在的"音乐噪声"问题,引入了一种改进的基于几何谱减法的语音增强算法。大大消除了背景噪声,改善了"音乐噪声"现象,保持了较好的语音可懂度和自然度。  相似文献   

2.
依据航空噪声的频谱特性,分析了利用频域短时能量进行语音端点检测的方法,通过前向和后向语音能量的判别,增加过渡帧来保证语音所表达的语意的连续和完整。对谱减法做进一步改进,以能量为基础对过渡帧进行细分,对语音帧、过渡帧、噪声帧分别进行不同的处理,从而克服了令人厌烦的音乐噪声,在强航空噪声背景下,处理后的语音不仅信噪比得到了很大的提高,而且清晰度和可懂度也得到了很大的改善。这种方法运算简单,具有很好的应用前景。  相似文献   

3.
语音增强是语音处理中常用的手段,在传播语音信号的同时噪声信号也随之添加进来,为了得到纯净的语音信号,我们对带噪信号进行语音增强,我们一般使用谱减法进行语音增强,但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法,通过实验仿真表明,该方法有效地解决了噪声变化大情况下的语音增强。  相似文献   

4.
语音增强是语音处理中常用的手段,在传播语音信号的同时噪声信号也随之添加进来,为了得到纯净的语音信号,我们对带噪信号进行语音增强,我们一般使用谱减法进行语音增强,但面对变化较大的噪声效果不理想。文章提出了一种改进的谱减语音增强方法,通过实验仿真表明,该方法有效地解决了噪声变化大情况下的语音增强。  相似文献   

5.
高性能联合语音增强算法的研究   总被引:1,自引:0,他引:1  
讨论了一种抗恶劣噪声环境的联合语音增强新方法,即将自适应算法、多带谱相减算法和迭代谱相减结合的方法。仿真结果表明,新方法在极大地抑制背景噪声、音乐噪声的同时,保持了较好的语音可懂度。  相似文献   

6.
语音增强是语音信号处理的重要课题。根据基于最小值追踪的谱估计方法,提出了一种非平稳噪声环境下快速追踪噪声变化的方法,将其应用到改进后的谱减法中,以提升语音增强的效果。仿真结果表明,改进后的谱减法能有效降低背景噪声,提高输出语音信号的信噪比。  相似文献   

7.
基于噪声被掩蔽概率的优化语音增强方法   总被引:9,自引:0,他引:9  
利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法。研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数。考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量和用传统的增强方法估计的谱分量的加权求得,加权因子由噪声被掩蔽概率确定。语音增强性能的评估结果表明,这种优化的语音增强方法在减少语音失真与加强噪声抑制之间取得了良好的折衷,减少了语音的听觉失真, 有效地抑制了音乐噪声,提高了增强语音的清晰度。  相似文献   

8.
传统的FFT谱分析会产生比较严重的频谱泄漏,应用到语音增强中就会产生严重的音乐噪声.因此使用更加准确的频谱分析将会对整个语音增强系统有很大的改进.将全相位FFT谱分析与最优改进对数谱幅度(OM-LSA)语音估计器结合,提出了新型最优改进对数全相位谱幅度(OM-LapSA)语音估计器,给出了新型语音估计器的流程框图.实验仿真表明,提出的语音估计器增强算法在抑制音乐噪声、提高信噪比和减少语音失真方面要优于传统OM-LSA语音估计器增强算法.  相似文献   

9.
陈紫强 《电声技术》2007,31(5):56-59
谱减法是常用的单通道语音降噪方法,传统谱减法在抑制背景噪声的同时引入了“音乐噪声”,影响听觉效果。为了抑制音乐噪声,提出了一种基于后验信噪比的频域语音增强新方法,当后验信噪比较高时,采用基于后验信噪比的谱减法增强语音信号;当后验信噪比较低时,采用基于后验信噪比的谱衰减方法对含噪语音信号谱线进行衰减,达到语音增强的目的。仿真结果表明,基于后验信噪比的频域语音增强法具有较好的背景噪声和音乐噪声抑制效果,并保持了较好语音可懂度。  相似文献   

10.
一种引入延迟的语音增强算法   总被引:3,自引:0,他引:3  
针对传统语音增强算法中,只采用当前帧和当前帧以前的信息对当前帧语音谱进行估计而造成变电平噪声和音乐噪声的问题,采用一种改进的引入延迟的语音增强算法。通过引入延迟,可以在对当前帧语音谱进行估计时使用当前帧以后帧的信息,在噪声估计中采用类似路径搜索的双向搜索方法消除变电平噪声的影响,在先验信噪比估计中采用改进的非因果先验信噪比估计算法,消除低信噪比平滑不足带来的音乐噪声,在此基础上构建了一个完整的语音增强算法。实验结果表明,该算法基本不受变电平噪声的影响,而且音乐噪声和残留背景噪声都得到了很好的抑制。  相似文献   

11.
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。  相似文献   

12.
王辉  袁淑丹 《电声技术》2013,(11):40-44
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。  相似文献   

13.
支持向量回归在声音转换中的应用   总被引:1,自引:1,他引:0  
声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。将3种不同的回归方法:多项式回归,线性多变量回归以及支持向量回归分别应用于声音转换。实验分别对5个普通话元音进行转换。主观和客观评估了每种方法的语音转换质量。结果表明,支持向量回归具有更强的学习能力,使转换语音具有更好的目标倾向性。与多项式回归和线性多变量回归相比,支持向量回归既提高了泛化能力又避免了频谱不连续性,使转换语音与目标语音的频谱距离失真分别减少了33.29%和35.24%。  相似文献   

14.
For any given mixed-language text, a multilingual synthesizer synthesizes speech that is intelligible to human listener. However, as speech data are usually collected from native speakers to avoid foreign accent, synthesized speech shows speaker switching at language switching points. To overcome this, the multilingual speech corpus can be converted to a polyglot speech corpus using cross-lingual voice conversion, and a polyglot synthesizer can be developed. Cross-lingual voice conversion is a technique to produce utterances in target speaker’s voice from source speaker’s utterance irrespective of the language and text spoken by the source and the target speakers. Conventional voice conversion technique based on GMM tokenization suffer from degradation in speech quality as the spectrum is oversmoothed due to statistical averaging. The current work focuses on alleviating the oversmoothing effect in GMM-based voice conversion technique, using (source) language-specific mixture weights in a multi-level GMM followed by selective pole focusing in the unvoiced speech segments. The continuity between the frames of the converted speech is ensured by performing fifth-order mean filtering in the cepstral domain. For the current work, cross-lingual voice conversion is performed for four regional Indian languages and a foreign language namely, Tamil, Telugu, Malayalam, Hindi, and Indian English. The performance of the system is evaluated subjectively using ABX listening test for speaker identity and using mean opinion score for quality. Experimental results demonstrate that the proposed method effectively improves the quality and intelligibility mitigating the oversmoothing effect in the voice-converted speech. A hidden Markov model-based polyglot text-to-speech system is also developed, using this converted speech corpus, to further make the system suitable for unrestricted vocabulary.  相似文献   

15.
A new method was proposed to identify speech-segment endpoints based on the empirical mode decomposition (EMD) and a new wavelet entropy ratio with improving the accuracy of voice activity detection. With the EMD, the noise signals can be decomposed into several intrinsic mode functions (IMFs). Then the proposed wavelet energy entropy ratio can be used to extract the desired feature for each IMFs component. In view of the question that the method of voice endpoint detection based on the original wavelet entropy ratio cannot adapt to the low signal-to-noise ratio (SNR) condition, an appropriate positive constant was introduced to the basic wavelet energy entropy ratio with effectively improved discriminability between the speech and noise. After comparing the traditional wavelet energy entropy ratio with the proposed wavelet energy entropy ratio, the experiment results show that the proposed method is simple and fast. The speech endpoints can be accurately detected in low SNR environments.  相似文献   

16.
李力  俞一彪 《信号处理》2012,28(2):289-294
传统的语音转换方法往往着重于语音的声道特征和基频的转换,而忽视了其他的超音段韵律特征,这导致转换后的语音目标倾向性不够明显,合成语音自然度不高,不能很好地反应说话人个性化特征。本文在短时谱包络转换的基础上,加入了基频、语速、停顿、重音等多种超音段韵律特征进行转换处理,以提高语音转换性能。其中,采用基频目标模型对基音频率建模,然后运用高斯混合模型(GMM)训练得到转换规则,而语速、停顿、重音则采用基于单高斯统计分析的最大似然估计方法训练得到转换规则。实验结果表明,在加入超音段韵律特征转换之后,系统非常明显地提高了转换语音的目标倾向性和自然度。   相似文献   

17.
孔德廷 《通信技术》2020,(7):1699-1703
提出了一种基于高阶统计的改进型语音激活检测算法。相对于传统的语音激活检测算法,在语音信号存在不确定的条件下,利用LPC残差域的高阶统计属性量,作为语音/噪音信号的判决标准。综合引入的归一化偏度/峰度、偏峰比等高阶统计量和传统的噪音信号概率等一阶分析量,形成语音/噪音软判决机制,能够有效的识别带噪语音信号中的语音激活区域。计算机仿真结果表明,输入背景噪音为高斯噪音和类高斯噪音时,所提算法相对于传统算法的误判概率要低,且在低信噪比条件下,具有更好的识别性能。  相似文献   

18.
针对现有双通道语音活动检测(Voice Activity Detection, VAD)算法依赖于固定阈值难以在多种噪声环境下准确地检测语音和噪声,应用于手机消噪系统会造成语音失真或噪声消除不好等问题,该文提出一种基于神经网络的VAD算法,该算法以分频带能量差和归一化互通道相关为特征,采用神经网络对语音和噪声进行分类。在此基础上,将神经网络VAD与基于互通道信号功率比值的VAD相结合,提出一种新的适用于手机消噪系统的语音和噪声活动检测算法分别对语音和噪声进行检测,并以此进行噪声抑制处理,减少了消噪系统因VAD误判而造成的性能下降。实验结果表明,该处理方法在抑制背景噪声和减少语音失真等方面优于现有的消噪算法,对于方向性语音干扰也有很好的抑制效果。  相似文献   

19.
为提高语音通信系统在噪声环境下的使用性能,该文提出一种基于子带谱减与广义旁瓣抵消的双微阵列语音增强方法。基于双微阵列及子带结构分析,首先分别在低频带采用可变过减因子谱减法抑制噪声,在高频带采用修改互功率谱谱减法抑制非相干性噪声部分,再结合广义旁瓣抵消与端点检测进一步抑制强相关性噪声的影响。实验结果表明,该方法能够更加有效地抑制噪声的影响并提高语音的可懂度。  相似文献   

20.
为改善旋翼飞机空地语音通信质量,针对旋翼飞机螺旋桨造成的幅度调制(Amplitude Modulation, AM)信号复杂多频干扰以及恶劣机舱背景噪声,提出了一种通信语音时频掩膜智能增强方法,从而实现对机舱噪声与复杂干扰的有效抑制。该方法首先对原始时域语音信号进行分帧与加窗,通过短时傅里叶变换获取幅度谱与相位谱;然后将原始幅度谱作为网络输入,采用深度神经网络分析其语音信号的特征,采用长短期记忆网络挖掘语音信号的时序上下文信息,实现对语音时频掩膜的准确估计,并将其用于增强原始幅度谱以得到网络输出;最后结合原始相位谱,通过逆短时傅里叶变换获得增强后的时域语音信号。仿真与实际测试表明,该方法可有效抑制旋翼飞机环境下的干扰噪声,提高通信语音信号质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号