首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
从噪声背景中提取尽可能纯净的语音信号,增强有用信号,抑制、降低噪声干扰的技术称为语音增强技术。语音增强有着广泛的应用,因此寻求一种有效的算法对带噪语音信号进行处理得到较纯净的原始语音信号的研究有着很大的意义。多年来很多经典的语音增强算法被提出,如谱减算法,子空间算法等。文章提出了一种新颖的语音增强方法,即基于非负低秩稀疏分解的原理在强噪声环境下实现语音增强。把语音信号和噪声信号看做是一个非负低秩稀疏分解问题并且不断的优化算法分离出语音信号和噪声信号的幅度谱。实验结果表明在强噪声环境下这种方法对比一些传统的语音增强方法效果更好,具有更少的噪声残余与较低的语音失真等优点  相似文献   

2.
闵刚  张雄伟  杨吉斌  胡永刚  潘竞峰 《信号处理》2015,31(11):1411-1417
非负稀疏信号在欠定线性观测条件下的重构效果不理想,仍有进一步提高的余地。文中将非负稀疏信号重构建模为线性规划问题,在交替方向乘子法的框架下得到了具有闭合解形式的优化算法,且算法复杂度较低。为了进一步增强重构信号的稀疏性,提出了迭代加权线性规划算法,通过对权值向量和重构信号交替优化提高了重构准确率。实验仿真验证了算法的有效性,针对随机生成信号和实际语音能量谱这两类非负稀疏信号均取得了较好的重构效果,重构性能优于目前一些流行的稀疏重构算法。   相似文献   

3.
张天骐  张晓艳  周琳  胡延平 《信号处理》2020,36(11):1867-1876
相位谱补偿语音增强算法通过调整相位谱对噪声进行压缩,提高重构信号的质量。针对传统的相位谱补偿(phase spectrum compensation, PSC)语音增强算法采用固定的相位补偿因子,且算法的性能易受噪声估计准确性的影响,提出了一种基于稀疏性的相位谱补偿(sparsity-based phase spectrum compensation, SPSC)语音增强算法。首先,利用噪声估计算法得到噪声幅度谱,利用基于幅度谱的语音增强算法得到目标语音幅度谱;接着,通过噪声和目标语音幅度谱之间的局部信噪比(Signal-to-Noise Ratio, SNR)来估计谱时间稀疏性;然后,利用sigmoid函数改进相位补偿因子,联合补偿因子和谱时间稀疏性,得到SPSC函数。最后,使用SPSC函数对相位谱中的谱分量进行补偿,通过短时傅里叶逆变换得到最终增强后的语音信号。仿真实验表明,在四种不同背景噪声的低信噪比下,新的相位谱补偿算法使增强语音获得了更好的LSD、PESQ和segSNR指标,说明新的算法在低信噪比下,可以有效恢复带噪语音中的语音成分,对噪声抑制效果明显,增强语音的质量和听感均有一定提升。   相似文献   

4.
鲍长春  白志刚 《信号处理》2020,36(6):791-803
语音增强在语音信号处理领域举足轻重,其目的在于减少背景噪声对语音信号的影响。然而,如何从极度非平稳噪声环境下有效地分离出目标语音仍然是一个具有挑战性的问题。基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法利用非负的语音和噪声基矩阵来建模语音和噪声的频谱子空间,是目前一种先进的对抑制非平稳噪声非常有效的技术。本文首先详细地介绍了非负矩阵分解理论,包括非负矩阵分解模型,代价函数(Cost function)的定义以及常用的乘法更新准则(Multiplicative update rules)。然后,本文详细地介绍了基于非负矩阵分解的语音增强方法的基本原理,包括训练阶段和增强阶段的具体过程,并进行了实验,此外,还利用一个基于非负矩阵分解的语音重构实验验证了语音基矩阵对语音频谱的建模能力。最后,本文总结了传统的基于非负矩阵分解的算法的不足,并对一些现有的基于非负矩阵分解的算法分别做了一个简单的概述,包括其创新点和优缺点,并对比分析了几种具有代表性的方法。本文从历史的角度展示了基于非负矩阵分解的语音增强方法的不断发展。   相似文献   

5.
基于数据驱动字典和稀疏表示的语音增强   总被引:1,自引:0,他引:1       下载免费PDF全文
孙林慧  杨震 《信号处理》2011,27(12):1793-1800
本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(K singular value decomposition, K SVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语音增强方法那样减少或消去噪声,而是从字典中选取适当的原子表示纯净信号,从而把纯净信号从含噪信号中分离出来。对白噪声和有色噪声环境下重构语音进行了主客观评价。仿真结果显示:该方法能有效去除加性噪声,并且改善了语音质量。   相似文献   

6.
吕乾坤  高勇 《电声技术》2014,38(12):50-54
针对传统语音增强方法在非平稳噪声环境下增强效果不理想的问题,提出了一种基于稀疏约束的概率潜分量分析(PLCA)和谱掩蔽的语音增强算法。该算法分为训练和增强两个阶段。训练阶段用稀疏约束的PLCA(SPLCA)和无约束的PLCA分别对语音谱和噪声谱建模成意义清晰的边缘分布,并用期望最大(EM)算法求其最优边缘分布,得到语音字典和噪声字典。增强阶段固定训练的字典,利用SPLCA推导出对应的语音编码矩阵和噪声编码矩阵,初步重构出语音和噪声,最后利用谱掩蔽得到增强语音。实验结果表明,该算法在抑制噪声、提高信噪比和减少语音失真方面要优于传统方法。  相似文献   

7.
为了提升复杂噪声环境下语音增强效果,该文提出了一种基于双层字典学习的单通道语音增强方法。在训练阶段首先采用干净语音和噪声训练初始化特征子字典,然后基于区分性约束和抗混淆约束的优化函数训练双层联合字典,第一层字典表达语音信号和噪声的可区分分量,而第二层字典表达语音信号和噪声的易混淆成分。在测试阶段含噪语音在双层联合字典上投影得到稀疏系数矩阵,然后重构得到增强后的语音。该方法利用目标优化函数的约束性减少“交叉投影”现象的发生,降低了信号在联合字典的混淆,从而进一步提升了语音增强的效果。实验结果表明,从全局信噪比(SNR)、主观语音质量评估(PESQ)和对数频谱距离(LSD)三个方面评价,相比于基于稀疏约束非负矩阵分解和改进的维纳滤波的语音增强方法,该方法具有更好的性能,能够更有效地去除噪声。   相似文献   

8.
白志刚  鲍长春 《信号处理》2020,36(6):831-838
基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法需要和背景噪声类型匹配的噪声基矩阵(Basis matrix),而在实际中,这是很难被保证的。本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法,该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域,然后利用一个固定长度的滑动窗口(Sliding window)来包含若干帧最近过去的带噪语音的无语音帧,并用这些无语音帧的幅度谱在线更新噪声基矩阵,最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵,有效地解决了噪声基矩阵不匹配的问题。实验证明,本文所提的方法在线学习到的噪声基矩阵在大多数条件下比匹配训练集下训练得到的噪声基矩阵的性能还要优越。   相似文献   

9.
张倩敏  陶亮  周健  王华彬 《信号处理》2015,31(1):95-102
提出一种基于非对称代价函数的稀疏卷积非负矩阵分解方法。该方法利用板仓-斋藤距离作为目标代价函数来衡量目标矩阵与重建矩阵的差异,使得较小的矩阵元素具有较小的重建误差,并且该代价函数具有尺度不变性的特点。为了考察其在弱语音成分重建方面的优势,将本文提出的算法应用于耳语音谱分解及重建实验。实验结果表明,与基于欧氏距离和基于Kullback-Leibler(K-L)散度的卷积非负矩阵分解算法相比,本文算法对于弱语音成分具有更好的重构效果,重建后的语音信号具有较大的可懂度。   相似文献   

10.
色噪声环境中TLS-ESPRIT谐波谱重构语音增强研究   总被引:1,自引:0,他引:1  
为了提高语音在色噪声环境中的信噪比,提出了一种基于总体最小二乘旋转不变子空间技术(TLS—ESPRIT)谐波谱重构语音增强方法。通过对观察数据矩阵进行奇异值分解,有效地将信号及噪声分开。运用TLS—ESPRIT算法对语音谐波信号进行谱估计,重构语音信号,消除了帧与帧之间的噪声残留,得到了在巴克域上与原始语音几乎相同的语音信号。  相似文献   

11.
标准的非负矩阵分解(NMF)应用于高光谱解混时,容易受到噪声和异常值的干扰,解混效果较差。为了提高分解性能,该文将L21范数引入标准的NMF算法中,对模型进行了改进,从而提高算法的鲁棒性。其次,为了提高分解后丰度矩阵的稀疏性,将双重加权稀疏约束引入L21NMF模型中,使其中一个权值提高每个像元对应的丰度向量上的稀疏性,另一个权值提高每个端元对应的丰度向量上的稀疏性。同时,为了利用像元的全局空间分布信息,观察地物在不同图像中的真实分布情况,引入子空间结构正则项,提出了基于子空间结构正则化的L21非负矩阵分解(L21NMF-SSR)算法。通过在模拟数据集和真实数据集与其他经典算法的比较,验证了该算法具有更好的性能,同时具有去噪能力。  相似文献   

12.
提出一种基于非负矩阵分解(NMF)和最小二乘支持向量机(LS-SVM)的肖像漫画生成算法.在训练阶段,利用非负矩阵分解来对夸张特征空间数据降维,运用最小二乘支持向量机(LS-SVM)统计学习夸张漫画与人脸之间的关系,建立形状夸张模型.在应用阶段,利用AAM算法提取人脸特征点,形状夸张模型计算出相应的漫画特征点数据,经过图像变形和风格化即可得到最终的肖像漫画.算法实验表明,该算法可以合理地夸张主要特征并避免过度变形.  相似文献   

13.
一种新的自适应语音增强系统   总被引:4,自引:0,他引:4  
针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量,任何原始语音信号泄漏到参考信号中,都会导致原始语音信号失真和噪声抵消性能恶化这一问题,本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号,然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模,并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时,用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明,这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。  相似文献   

14.
何玉文  鲍长春  夏丙寅 《电子学报》2014,42(10):1991-1997
针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训练集和测试集的差异性,需在线调整语音模型和噪声模型中的能量,语音模型的能量调整采用迭代的期望最大化算法;噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法确定噪声能量调整的初始值.在ITU-T G.160标准下对算法进行性能测试,测试结果表明,本文方法对非平稳噪声的跟踪效果较好,对噪声衰减量较大,收敛时间较短.  相似文献   

15.
结合人耳听觉感知的两级语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有语音增强算法面临残留噪声这一问题,结合人耳听觉系统的掩蔽特性,本文提出了一种优化的语音增强算法。算法分为两级,第一级利用MMSE-LSA谱估计法对带噪语音进行降噪处理,经过处理后,带噪语音信号的信噪比得到了提高。然后,针对第一级增强语音信号中的残余噪声利用人耳听觉掩蔽特性掩蔽掉。为此,算法结合人耳听觉掩蔽特性设计了感知增强滤波器,该滤波器能够有效去除第一级增强语音信号中的残留噪声。仿真实验表明,在各种复杂背景噪声以及信噪比环境下,经过本文算法处理后的增强语音信号残留噪声明显减少,算法提升了增强语音的主观感知质量。   相似文献   

16.
提出了一种基于听觉掩蔽效应的语音增强算法。算法对含噪语音的增强包括谱减法语音增强和感知加权语音增强两个步骤,分别从客观和主观两方面来提高含噪语音的质量。在谱减法阶段考虑了语音和噪声谱的交叉项,有效地减少了增强语音中的残余噪声;在感知加权处理中充分利用了人耳的掩蔽效应,设计了感知加权滤波器,对谱减法增强后的语音进行滤波,进一步消除残余噪声。对算法进行了数值实验,实验结果表明该算法能有效提高含噪语音的质量,比传统的谱减法有较大改进。  相似文献   

17.
Journal of Signal Processing Systems - In this paper, we propose a novel single channel speech enhancement approach that takes up the Stationary Wavelet Transform (SWT) and Nonnegative Matrix...  相似文献   

18.
基于非负矩阵分解的高光谱遥感图像混合像元分解   总被引:3,自引:0,他引:3  
传统非负矩阵分解算法的目标函数具有大量的局部极小,在进行高光谱图像的光谱解混时,受初始值的影响很大.为解决该问题,作者通过在目标函数中引入丰度分离性和平滑性的约束条件,提出一种基于有约束非负矩阵分解的混合像元分解方法.同时该算法能够满足混合像元分解问题所要求的丰度值非负以及和为一的约束.模拟和实际数据实验结果表明,所提...  相似文献   

19.
Most of the existing algorithms for blind sources separation have a limitation that sources are statistically independent. However, in many practical applications, the source signals are non- negative and mutual statistically dependent signals. When the observations are nonnegative linear combinations of nonnegative sources, the correlation coefficients of the observations are larger than these of source signals. In this letter, a novel Nonnegative Matrix Factorization (NMF) algorithm with least correlated ...  相似文献   

20.
This paper describes an algorithm to suppress composite noise in a two‐microphone speech enhancement system for robust hands‐free speech communication. The proposed algorithm has four stages. The first stage estimates the power spectral density of the residual stationary noise, which is based on the detection of nonstationary signal‐dominant time‐frequency bins (TFBs) at the generalized sidelobe canceller output. Second, speech‐dominant TFBs are identified among the previously detected nonstationary signal‐dominant TFBs, and power spectral densities of speech and residual nonstationary noise are estimated. In the final stage, the bin‐wise output signal‐to‐noise ratio is obtained with these power estimates and a Wiener post‐filter is constructed to attenuate the residual noise. Compared to the conventional beamforming and post‐filter algorithms, the proposed speech enhancement algorithm shows significant performance improvement in terms of perceptual evaluation of speech quality.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号