期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于DCT与维纳滤波的单通道语音增强算法 总被引：5，自引：0，他引：5

欧世峰赵晓晖顾海军《通信学报》2006,27(10):86-93

针对复杂噪声背景下的语音增强问题,基于离散余弦变换(DCT)和维纳滤波提出了一种新的单通道语音增强算法。该算法不依赖任何语音信号模型且无需对噪声的统计特性进行先验假定,它利用DCT域中连续时刻语音信号分量间的相关特性结合最小均方误差算法实现纯净语音分量的最优估计,弥补了一般算法仅依赖单帧带噪语音对语音分量估计得不足。多种噪声背景下的仿真结果表明,该算法在主观和客观测试中都具有良好的语音增强效果。相似文献

2.

一种DCT域的语音增强改进算法

高留洋桑振夏杨晓杰李文君《现代电子技术》2011,(23):59-62

提出了一种DCT域的语音增强改进算法。该算法依据DCT域语音分量和噪声分量统计分布的不同,采用最大后验概率估计方法对语音分量进行精确估计,实现将语音信号从噪声环境中分离出来,从而有效地改善语音质量。在低信噪比条件下,该算法可以有效降噪,且增强效果较频域增强算法更好。相似文献

3.

基于两步噪声消除技术与高斯统计模型的语音增强算法

欧世峰王显云高颖赵晓晖《信号处理》2011,27(8):1171-1178

针对语音增强技术中先验信噪比参数的估计问题,本文通过结合两步噪声消除技术以及语音与噪声分量的高斯统计模型,在频率域中提出了一种新的先验信噪比估计算法。该算法基于直接判决方法的输出结果,利用最小均方误差估计理论直接计算当前帧纯净语音分量的谱能量,以获取带噪语音的先验信噪比估计。算法在保留两步噪声消除算法优点的基础上,无需语音增强系统中增益因子的任何先验条件,且在有效消除背景噪声的同时能够最大程度地抑制输出语音中音乐噪声的生成。多种噪声背景下的仿真结果表明:相对于经典的直接判决方法和新近的两步噪声消除算法,基于本文先验信噪比估计方案的语音增强系统在主观与客观评价标准下都具有更加优良的语音增强效果。相似文献

4.

基于高斯混合模型的压缩域语音增强方法

下载免费PDF全文

梁岩鲍长春夏丙寅何玉文周璇李娜《电子学报》2012,40(10):2031-2038

为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度;然后,在最小均方误差 (MMSE) 准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量;且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-T G.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优. 相似文献

5.

新型拉普拉斯模型因子估计语音增强算法

黄伟欧世峰《现代电子技术》2010,33(21):100-103

针对拉普拉斯先验模型下的语音增强问题,给出了一种模型因子估计算法,它利用语音分量方差与模型因子的对应关系来获取模型因子的估计;在语音分量方差的估计过程中,通过利用带噪语音分量与先前帧语音方差计算当前帧语音分量方差,提出一种新的语音分量方差估计算法。通过结合这两种新算法获得的拉普拉斯模型因子估计能够有效消除噪声分量能量对估计精度的影响,且提高系统的语音增强性能。多种噪声背景下的仿真结果表明,基于该模型因子估计方案的方法的语音增强算法具有更好的增强效果。相似文献

6.

基于多元Laplace语音模型的语音增强算法 总被引：1，自引：0，他引：1

周彬邹霞张雄伟《电子与信息学报》2012,34(7):1562-1567

传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法在抑制背景噪声和减少语音失真等方面优于传统的语音增强方法。相似文献

7.

基于Gaussian-Gamma 模型的语音激活检测

韩韬王玲刘辉《微电子学与计算机》2008,25(4):59-62

语音端点检测是语音信号预处理过程中的一个重要环节,而在实际的噪声环境下,一些传统的端点检测方法已经不适用,为了提高在强背景噪声条件下语音端点检测的性能,提出了一种在DCT变换域下,基于Gaussian-Gamma模型的语音端点检测算法,设定其纯净语音信号的统计分布函数为Gamma分布,其相应参数使用了最大似然估计以及预测估计的方法.该算法具有较高的准确性和稳健性.仿真实验表明,该方法鲁棒性较好,在较低的信噪比下仍能比较准确的检测到语音信号的端点. 相似文献

8.

基于蒙特卡洛滤波平滑的语音增强算法

董航孙洪《信号处理》2005,21(Z1):223-226

本文在分析统计信号贝叶斯模型和语音信号的时变自回归(TVAR)模型的基础上,利用蒙特卡洛滤波及平滑方法,对语音信号的TVAR模型参数进行了估计,提出了一种有效的针对非平稳加性噪声影响下的语音增强算法.该算法可以很好的跟踪非平稳信号,同时引入对反射系数的判断,保证了跟踪的稳定性.实验表明,本文方法能很好的抑制背景噪声,提高信噪比,改善语音信号的听觉质量. 相似文献

9.

基于SWT自适应模糊萎缩的SAR图像降斑算法

吴艳王霞廖桂生《电波科学学报》2006,21(6):944-949

提出了基于小波域高斯混合模型贝叶斯估计模糊萎缩的SAR图像降斑算法.该算法分析了SAR图像在平稳小波变换(SWT)域中的统计模型,并用高斯混合模型对其进行描述,推导出基于贝叶斯估计的信号最小均方误差(MMSE)的模糊萎缩因子.籍此再根据小波域相邻尺度间小波系数的相关性,采用分区域模糊萎缩思想,很好地得到无斑点真实信号小波系数的估计.仿真结果表明该算法在大大抑制斑点噪声的同时,有效的保持了边缘,其性能优于改进Lee滤波,小波软阈值和SWT萎缩降斑算法. 相似文献

10.

基于近似KLT域的语音信号压缩感知 总被引：7，自引：2，他引：7

郭海燕杨震《电子与信息学报》2009,31(12):2948-2952

压缩感知是近年来兴起的研究热点,该文基于语音信号在KLT域的稀疏特性,提出了基于模板匹配的近似KLT,并在基于模板匹配近似KLT域上研究了语音信号的压缩感知性能。首先验证语音信号在基于模板匹配近似KLT域上的稀疏性,然后由语音信号与观测矩阵构造相应的观测,采取固定分配每帧观测个数和按帧能量自适应分配每帧观测个数两种方案,再以观测为已知条件利用L1优化算法重构语音信号在基于模板匹配近似KLT域的稀疏系数向量,进而重构原始语音信号。实验表明,语音信号在基于模板匹配的近似KLT域的压缩感知性能较好。相似文献

11.

A Bayesian estimation approach for speech enhancement using hiddenMarkov models

Ephraim Y. 《Signal Processing, IEEE Transactions on》1992,40(4):725-735

A Bayesian estimation approach for enhancing speech signals which have been degraded by statistically independent additive noise is motivated and developed. In particular, minimum mean square error (MMSE) and maximum a posteriori (MAP) signal estimators are developed using hidden Markov models (HMMs) for the clean signal and the noise process. It is shown that the MMSE estimator comprises a weighted sum of conditional mean estimators for the composite states of the noisy signal, where the weights equal the posterior probabilities of the composite states given the noisy signal. The estimation of several spectral functionals of the clean signal such as the sample spectrum and the complex exponential of the phase is also considered. A gain-adapted MAP estimator is developed using the expectation-maximization algorithm. The theoretical performance of the MMSE estimator is discussed, and convergence of the MAP estimator is proved. Both the MMSE and MAP estimators are tested in enhancing speech signals degraded by white Gaussian noise at input signal-to-noise ratios of from 5 to 20 dB 相似文献

12.

压缩感知下的稀疏表示语声恢复模型与算法

下载免费PDF全文

李洋李双田《信号处理》2014,30(8):914-923

本文讨论的语声信息恢复旨在提高带噪语声的可懂度。通过类比听觉掩蔽与视觉闭塞,在基于稀疏表示的图像去噪思想启发下,本文提出了基于压缩感知理论的稀疏表示语声恢复模型、数学表达式以及算法。与传统的语声增强算法不同,本文模型与算法的特点在于具备有效消除全局噪声干扰和恢复局部被噪声掩蔽的语声成分的双重能力,有效提高了处理后语声的可懂度。仿真实验和客观语声质量测度验证了提出的模型与算法的可行性、有效性以及优越性。相似文献

13.

基于频带间相关性的加权噪声功率谱估计

下载免费PDF全文

冯炎尼玛扎西《太赫兹科学与电子信息学报》2010,8(4):431-435

噪声功率谱估计是语音增强系统的一个重要组成部分。本文在加权噪声估计的基础上,考虑了带噪语音在相邻频带间的相关性,提出了一种新的噪声功率谱估计算法。该算法保留了加权噪声估计算法的优点,利用频域平滑及时域平滑后的带噪语音来求加权因子,能够更好地区分弱语音与噪声,尤其是对强语音后的弱语音与噪声区分更明显,从而具有更快的跟踪速度及更少的噪声过估计。客观实验和主观实验都证实了本文提出的算法的有效性。相似文献

14.

Nonlinear cepstral equalisation method for noisy speech recognition

Lee L.-M. Chen J.-K. Wang H.-C. 《Vision, Image and Signal Processing, IEE Proceedings -》1994,141(6):397-402

The authors deal with the problem of automatic speech recognition in the presence of additive white noise. The effect of noise is modelled as an additive term to the power spectrum of the original clean speech. The cepstral coefficients of the noisy speech are then derived from this model. The reference cepstral vectors trained from clean speech are adapted to their appropriate noisy version to best fit the testing speech cepstral vector. The LPC coefficients, LPC derived cepstral coefficients, and the distance between test and reference, are all regarded as functions of the noise ratio (the spectral power ratio of noise to noisy speech). A gradient based algorithm is proposed to find the optimal noise ratio as well as the minimum distance between the test cepstral vector and the noise adapted reference. A recursive algorithm based on Levinson-Durbin recursion is proposed to simultaneously calculate the LPC coefficients and the derivatives of the LPC coefficients with respect to the noise ratio. The stability of the proposed adaptation algorithm is also addressed. Experiments on multispeaker (50 males and 50 females) isolated Mandarin digits recognition demonstrate remarkable performance improvements over noncompensated method under noisy environment. The results are also compared to the projection based approach, and experiments show that the proposed method is superior to the projection approach under a severe noisy environment 相似文献

15.

基于噪声被掩蔽概率的优化语音增强方法 总被引：9，自引：0，他引：9

卜凡亮王为民戴启军陈砚圃《电子与信息学报》2005,27(5):753-756

利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法。研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数。考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量和用传统的增强方法估计的谱分量的加权求得,加权因子由噪声被掩蔽概率确定。语音增强性能的评估结果表明,这种优化的语音增强方法在减少语音失真与加强噪声抑制之间取得了良好的折衷,减少了语音的听觉失真, 有效地抑制了音乐噪声,提高了增强语音的清晰度。相似文献

16.

A noise reduction technique of speech signal using ICA and spectral analysis

A. Revathi R. Chinnadurai Y. Venkataramani 《International Journal of Electronics》2013,100(12):1171-1179

This paper discusses the new method on noise reduction exploiting the combined effects of wavelet decomposition, ICA and spectral analysis on noisy speech. The input noisy speech is wavelet decomposed into two signals. Wavelet entropy is computed based on the modified probability density function for the signal derived from the approximation coefficients during wavelet decomposition. By proper entropy comparison, the starting frame is detected. Between the two signals obtained from the wavelet decomposition, one is speech combined with noise and another one is noise alone. These two signals are analysed in independent component analysis (ICA) domain, in order to generate an enhanced speech. Zero-crossing rate is computed and used to discriminate between speech and noise. Then, spectral analysis is performed on the noise prior to starting frame and noisy speech. Elimination of noise frequencies in the noisy speech leads to noise reduced speech. Subjective analysis and experimental results show the considerable noise reduction capability of the proposed algorithm. 相似文献

17.

Speech enhancement based conceptually on auditory evidence

Cheng Y.M. O'Shaughnessy D. 《Signal Processing, IEEE Transactions on》1991,39(9):1943-1954

A new idea, enhancing speech based on auditory evidence, is explored for the problem of enhancing speech degraded by stationary and nonstationary additive white noise. Distinguishing different objectives for heavy and light noise interference, two related algorithms are developed. For speech degraded by heavy noise, the improvement in signal-to-noise ratio (SNR) is as high as 12 dB; for lightly noisy speech, the improvement is modest and decreases as the SNR of the noisy speech increases. Quantizing noise is used to assess the capacity for reducing nonstationary noise using these algorithms; a significant reduction of such noise and an improvement in speech quality are achieved. The advantages of the proposed algorithms for speech enhancement include no need for prior knowledge of the noise and only a modest computational requirement 相似文献

18.

一种新的基于数据场的语音增强算法

黄建军张雄伟张亚非淦文燕邹霞《信号处理》2011,27(8):1200-1205

语音增强是消除噪声干扰的主要手段,在语音处理系统中得到广泛应用。传统语音增强算法认为相邻帧语音幅度谱之间是相互独立的,而研究表明语音幅度谱时频点之间存在相互依赖关系。缺乏对邻域时频结构信息的利用使得传统增强算法的性能难以进一步提高。本文首次将数据场引入到对语音的听觉感知领域,用数据场对语音的时频依赖性进行建模,提出一种新的基于数据场的语音增强算法。该算法通过最小化势场分布的熵确定了时频点之间的相互作用力程,在带噪语音数据场中估计噪声的最小统计量得到二值时频掩蔽值,最后利用二值时频掩蔽消除噪声干扰。实验测试表明,与Martin算法相比,基于数据场的语音增强算法在提高去噪效果的同时能有效减少语音的失真。相似文献