首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
白志刚  鲍长春 《信号处理》2020,36(6):831-838
基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法需要和背景噪声类型匹配的噪声基矩阵(Basis matrix),而在实际中,这是很难被保证的。本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法,该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域,然后利用一个固定长度的滑动窗口(Sliding window)来包含若干帧最近过去的带噪语音的无语音帧,并用这些无语音帧的幅度谱在线更新噪声基矩阵,最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵,有效地解决了噪声基矩阵不匹配的问题。实验证明,本文所提的方法在线学习到的噪声基矩阵在大多数条件下比匹配训练集下训练得到的噪声基矩阵的性能还要优越。   相似文献   

2.
本文提出了一种改进的非负矩阵分解语音增强算法,该算法可分为训练和增强两部分。首先,为了降低训练复杂度,采用卷积非负矩阵分解只提取噪声字典。增强时,考虑语音信号稀疏性比噪声信号稀疏性强,通过稀疏非负矩阵分解重构出语音幅度谱,采用交替方向乘子法进行优化迭代,克服了经典乘性迭代易陷入局部最优、分母只能收敛到零极限等问题。最后,基于算法融合的思想,将重构的语音幅度谱与谱减法、最小均方误差幅度谱估计得到的幅度谱进行加权融合。仿真实验中,在10种不同噪声环境中,通过多种评价标准证明所提算法能取得较好的增强效果。   相似文献   

3.
加性噪声条件下鲁棒说话人确认   总被引:1,自引:0,他引:1       下载免费PDF全文
张二华  王明合  唐振民 《电子学报》2019,47(6):1244-1250
基于非负矩阵分解的语音去噪,在提高语音信号信噪比的同时,也会引起语音失真,从而导致噪声环境下说话人确认系统性能下降.本文提出基于分区约束非负矩阵分解的语音去噪方法(Nonnegative Matrix Factorization with Partial Constrains,PCNMF),目的是在未知和非平稳噪声条件下提高话人确认系统的鲁棒性.PCNMF在满足分区约束条件的基础上分别构建语音字典和噪声字典.考虑到传统语音训练产生的语音字典往往含有一定的噪声成分,PCNMF通过数学模型产生基音及泛音频谱,在此基础上利用该频谱模仿人声的共振峰结构来合成字典,从而保证语音字典纯净性.另一方面,为了克服传统噪声字典构建方法带来的部分噪声信息丢失问题,PCNMF对在线分离出的噪声样本进行分帧和短时傅里叶变换,然后以帧为单位线性组合生成噪声字典.性能评估实验引入了多种噪声类型,实验结果表明PCNMF可有效提高说话人确认系统的鲁棒性,特别是在未知和非平稳噪声条件下其等错率相比基线系统(Multi-Condition)平均降低了5.2%.  相似文献   

4.
吕乾坤  高勇 《电声技术》2014,38(12):50-54
针对传统语音增强方法在非平稳噪声环境下增强效果不理想的问题,提出了一种基于稀疏约束的概率潜分量分析(PLCA)和谱掩蔽的语音增强算法。该算法分为训练和增强两个阶段。训练阶段用稀疏约束的PLCA(SPLCA)和无约束的PLCA分别对语音谱和噪声谱建模成意义清晰的边缘分布,并用期望最大(EM)算法求其最优边缘分布,得到语音字典和噪声字典。增强阶段固定训练的字典,利用SPLCA推导出对应的语音编码矩阵和噪声编码矩阵,初步重构出语音和噪声,最后利用谱掩蔽得到增强语音。实验结果表明,该算法在抑制噪声、提高信噪比和减少语音失真方面要优于传统方法。  相似文献   

5.
水声目标的特征相似和海洋环境噪声的多变,使得非负矩阵分解(NMF)算法的信号增强效果不佳.为此,提出基于改进NMF的增强算法,该算法一方面使用实际海洋环境噪声实时更新背景噪声基矩阵,以增强基向量的匹配性,另一方面对特征基矩阵进行相似检测去冗余,以消除系数分散造成的基向量丢失,最后构建增强滤波器实现目标信号的重构增强.实验结果表明,相比于正则化NMF算法、改进正交匹配追踪方法,所提算法取得最优的信号增强效果,并通过实测数据轴频提取实验结果进一步验证了所提算法的有效性.  相似文献   

6.
张倩敏  陶亮  周健  王华彬 《信号处理》2015,31(1):95-102
提出一种基于非对称代价函数的稀疏卷积非负矩阵分解方法。该方法利用板仓-斋藤距离作为目标代价函数来衡量目标矩阵与重建矩阵的差异,使得较小的矩阵元素具有较小的重建误差,并且该代价函数具有尺度不变性的特点。为了考察其在弱语音成分重建方面的优势,将本文提出的算法应用于耳语音谱分解及重建实验。实验结果表明,与基于欧氏距离和基于Kullback-Leibler(K-L)散度的卷积非负矩阵分解算法相比,本文算法对于弱语音成分具有更好的重构效果,重建后的语音信号具有较大的可懂度。   相似文献   

7.
为了提高认知无线电系统中低信噪比条件下的频谱感知性能,提出了基于非负矩阵分解的频谱感知方法。在无需知道被感知信号的先验信息的条件下,将原始信号进行短时傅里叶变换后,利用非负矩阵分解的噪声与信号之间的特征矩阵存在的差异性,将特征矩阵作为检测统计量进行频谱感知。仿真结果表明,基于非负矩阵分解的频谱感知方法在低信噪比条件下,具有较传统的能量检测方法与循环平稳检测方法更优的感知性能。  相似文献   

8.
从噪声背景中提取尽可能纯净的语音信号,增强有用信号,抑制、降低噪声干扰的技术称为语音增强技术。语音增强有着广泛的应用,因此寻求一种有效的算法对带噪语音信号进行处理得到较纯净的原始语音信号的研究有着很大的意义。多年来很多经典的语音增强算法被提出,如谱减算法,子空间算法等。文章提出了一种新颖的语音增强方法,即基于非负低秩稀疏分解的原理在强噪声环境下实现语音增强。把语音信号和噪声信号看做是一个非负低秩稀疏分解问题并且不断的优化算法分离出语音信号和噪声信号的幅度谱。实验结果表明在强噪声环境下这种方法对比一些传统的语音增强方法效果更好,具有更少的噪声残余与较低的语音失真等优点  相似文献   

9.
非平稳环境下基于人耳听觉掩蔽特性的语音增强   总被引:9,自引:0,他引:9  
传统的语音增强算法往往仅对平稳噪声或缓慢变化的噪声有效,且残留的音乐噪声较大。对此,本文研究了一种非平稳环境下基于听觉掩蔽效应的语音增强算法。该算法对传统谱减法的功率谱估计算法进行改进,根据最小均方误差原则和语音信号的听觉掩蔽阈值调整功率谱估计的参数,并引入了基于最小值统计特性的噪声估计算法,使估计的噪声更好地跟踪噪声的变化。实验结果表明:该算法对平稳和非平稳的噪声都得到较好的增强效果,且较好地抑制了音乐噪声。  相似文献   

10.
提出一种基于非负矩阵分解NMF(Non-negative Matrix Factorization)的脆弱数字水印算法。算法利用用户密钥构造NMF基矩阵,并在图像NMF分解过程中保持不变,二值水印图像嵌入NMF分解系数矩阵。实验结果本算法具有较强的鲁棒性,同时用户密钥保证的算法的脆弱性。  相似文献   

11.
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法   总被引:3,自引:1,他引:2       下载免费PDF全文
郭莉莉  鲍长春 《电子学报》2009,37(5):1146-1153
 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Characteristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW 的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当.  相似文献   

12.
不完全非负矩阵分解的加速算法   总被引:5,自引:0,他引:5       下载免费PDF全文
非负矩阵分解(NMF)已成为数据分析与处理的一种日益流行的方法.当数据矩阵不完全时,可用加权非负矩阵分解(WNMF)来分解矩阵.但是在WNMF算法中,对于给定的搜索方向,步长的选取一般来说不是最优的.本文研究了不完全非负矩阵分解(INMF)问题,提出了加速算法(AINMF).首先,将INMF问题转化为交替地求解两个非负...  相似文献   

13.
This paper describes an algorithm to suppress composite noise in a two‐microphone speech enhancement system for robust hands‐free speech communication. The proposed algorithm has four stages. The first stage estimates the power spectral density of the residual stationary noise, which is based on the detection of nonstationary signal‐dominant time‐frequency bins (TFBs) at the generalized sidelobe canceller output. Second, speech‐dominant TFBs are identified among the previously detected nonstationary signal‐dominant TFBs, and power spectral densities of speech and residual nonstationary noise are estimated. In the final stage, the bin‐wise output signal‐to‐noise ratio is obtained with these power estimates and a Wiener post‐filter is constructed to attenuate the residual noise. Compared to the conventional beamforming and post‐filter algorithms, the proposed speech enhancement algorithm shows significant performance improvement in terms of perceptual evaluation of speech quality.  相似文献   

14.
王超  赵阳  裴继红 《信号处理》2020,36(7):1127-1135
针对实际监控场景中经常遇到的人脸图像分辨率较低的问题,本文提出了一种利用耦合非负矩阵分解并保持系数松弛的低分辨率人脸识别算法(Relaxed Coupled Nonnegative Matrix Factorization,后文简称RCNMF)。首先,对高低分辨率人脸图像进行非负矩阵矩阵分解(nonnegative matrix factorization,后文简称NMF),在分解的同时保持组合系数近似一致,从而得到高低分辨率图像的基矩阵。然后,通过低分辨率图像的基矩阵提取训练和测试样本的特征。最后进行识别。实验结果验证了与其他几种基于耦合映射的低分辨率人脸识别方法相比,RCNMF算法的识别性能更好。同时通过实验验证了RCNMF算法的收敛性。   相似文献   

15.
A new idea, enhancing speech based on auditory evidence, is explored for the problem of enhancing speech degraded by stationary and nonstationary additive white noise. Distinguishing different objectives for heavy and light noise interference, two related algorithms are developed. For speech degraded by heavy noise, the improvement in signal-to-noise ratio (SNR) is as high as 12 dB; for lightly noisy speech, the improvement is modest and decreases as the SNR of the noisy speech increases. Quantizing noise is used to assess the capacity for reducing nonstationary noise using these algorithms; a significant reduction of such noise and an improvement in speech quality are achieved. The advantages of the proposed algorithms for speech enhancement include no need for prior knowledge of the noise and only a modest computational requirement  相似文献   

16.
We present an algorithm for blindly recovering constituent source spectra from magnetic resonance (MR) chemical shift imaging (CSI) of the human brain. The algorithm, which we call constrained nonnegative matrix factorization (cNMF), does not enforce independence or sparsity, instead only requiring the source and mixing matrices to be nonnegative. It is based on the nonnegative matrix factorization (NMF) algorithm, extending it to include a constraint on the positivity of the amplitudes of the recovered spectra. This constraint enables recovery of physically meaningful spectra even in the presence of noise that causes a significant number of the observation amplitudes to be negative. We demonstrate and characterize the algorithm's performance using 31P volumetric brain data, comparing the results with two different blind source separation methods: Bayesian spectral decomposition (BSD) and nonnegative sparse coding (NNSC). We then incorporate the cNMF algorithm into a hierarchical decomposition framework, showing that it can be used to recover tissue-specific spectra given a processing hierarchy that proceeds coarse-to-fine. We demonstrate the hierarchical procedure on 1H brain data and conclude that the computational efficiency of the algorithm makes it well-suited for use in diagnostic work-up.  相似文献   

17.
从重叠比较严重的混合物三维荧光光谱中恢复单一光谱信号,是光谱解析的难点。考虑到光谱内在的非负性,采用非负矩阵分解的投影梯度和交替最小二乘两种算法,并结合K均值初始化方法,来解析菲、芘、蒽3种芳烃混合物的三维荧光光谱数据,有效避免出现负数的分解结果,提取3种成份的三维荧光光谱,得到计算光谱与对应参考光谱的相似系数均大于0.970。计算结果表明,非负矩阵分解能够克服光谱重叠带来的干扰,有效提取光谱成份,从而实现对菲、芘、蒽的成份识别。其中,交替最小二乘的NMF算法更适合实时在线监测。  相似文献   

18.
This paper describes an audio source separation that is based on nonnegative matrix factorization (NMF) and expectation maximization (EM). For stable and high‐performance separation, an effective auxiliary source separation that extracts source residuals and reprojects them onto proper sources is proposed by taking into account an ambiguous region among sources and a source's refinement. Specifically, an additional NMF (model) is designed for the ambiguous region — whose elements are not easily represented by any existing or predefined NMFs of the sources. The residual signal can be extracted by inserting the aforementioned model into the NMF‐EM‐based audio separation. Then, it is refined by the weighted parameters of the separation and reprojected onto the separated sources. Experimental results demonstrate that the proposed scheme (outlined above) is more stable and outperforms existing algorithms by, on average, 4.4 dB in terms of the source distortion ratio.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号