共查询到17条相似文献,搜索用时 31 毫秒
1.
2.
语音增强在语音信号处理领域举足轻重,其目的在于减少背景噪声对语音信号的影响。然而,如何从极度非平稳噪声环境下有效地分离出目标语音仍然是一个具有挑战性的问题。基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法利用非负的语音和噪声基矩阵来建模语音和噪声的频谱子空间,是目前一种先进的对抑制非平稳噪声非常有效的技术。本文首先详细地介绍了非负矩阵分解理论,包括非负矩阵分解模型,代价函数(Cost function)的定义以及常用的乘法更新准则(Multiplicative update rules)。然后,本文详细地介绍了基于非负矩阵分解的语音增强方法的基本原理,包括训练阶段和增强阶段的具体过程,并进行了实验,此外,还利用一个基于非负矩阵分解的语音重构实验验证了语音基矩阵对语音频谱的建模能力。最后,本文总结了传统的基于非负矩阵分解的算法的不足,并对一些现有的基于非负矩阵分解的算法分别做了一个简单的概述,包括其创新点和优缺点,并对比分析了几种具有代表性的方法。本文从历史的角度展示了基于非负矩阵分解的语音增强方法的不断发展。 相似文献
4.
非负矩阵分解是在非负限制下的一种将一个高维矩阵分解为两个低维矩阵的分解技术。目前,存在的算法大部分是基于乘性迭代算法和交替最小二乘算法。针对交替最小二乘算法的子问题,文中提出了一种有效集BB梯度法,且该算法是全局收敛的。实验结果显示,该算法比投影梯度算法更为有效。 相似文献
5.
6.
7.
8.
非负矩阵分解(Nonnegative Matrix Factorization,NMF)是一种新近被提出的方法,它以非线性的方式实现对非负多元数据的纯加性、局部化、线性和低维描述。NMF可使数据中的潜在结构、特征或模式变得清晰,因此它作为一种有效的特征提取手段已被成功应用在许多领域的研究中。但是,NMF 的处理对象本质上是向量,用NMF处理数据矩阵集时要先将被处理矩阵集中的矩阵逐一矢量化,这常使对应的学习问题成为典型的小样本问题,从而使NMF结果的描述力不强、推广性差。为克服这两个问题,并保留NMF的好的特性,该文提出了非负矩阵集分解(Nonnegative Matrix-Set Factorization,NMSF),不同于NMF处理数据矩阵的矢量化结果,NMSF直接处理数据矩阵本身。理论分析显示:处理数据矩阵集时,NMSF会比NMF描述力强、推广性好。为了说明NMSF如何实现,也为了能对NMSF的性能做实验验证,构造了NMSF实现方式之一的基于双线性型的NMSF(Bilinear Form-Based NMSF,BFBNMSF)算法。BFBNMSF和NMF的比较实验结果支持了理论分析的结论。需要指出,更佳的描述力和更好的推广性意味着NMSF比NMF更善于抓住数据矩阵的本质特征。 相似文献
9.
交替最小二乘法由于其理论可靠性和实际有效性成为非负矩阵分解中备受欢迎的方法之一。文中基于交替最小二乘法将界约束优化中的积极集共轭梯度法运用到非负矩阵分解当中,算法在子问题的求解中,并利用子空间的思想来划分指标集,并利用文献CHENG Wangyou文中的共轭梯度法进行变量更新,在一定条件下证明了新算法的收敛性,实验结果表明算法是有效的。 相似文献
10.
基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法需要和背景噪声类型匹配的噪声基矩阵(Basis matrix),而在实际中,这是很难被保证的。本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法,该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域,然后利用一个固定长度的滑动窗口(Sliding window)来包含若干帧最近过去的带噪语音的无语音帧,并用这些无语音帧的幅度谱在线更新噪声基矩阵,最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵,有效地解决了噪声基矩阵不匹配的问题。实验证明,本文所提的方法在线学习到的噪声基矩阵在大多数条件下比匹配训练集下训练得到的噪声基矩阵的性能还要优越。 相似文献
11.
《IEEE transactions on circuits and systems. I, Regular papers》2008,55(8):2356-2367
12.
Nonnegative matrix factorization (NMF) is a popular method for low-rank approximation of nonnegative matrix, providing a useful tool for representation learning that is valuable for clustering and classification. When a portion of data are labeled, the performance of clustering or classification is improved if the information on class labels is incorporated into NMF. To this end, we present semi-supervised NMF (SSNMF), where we jointly incorporate the data matrix and the (partial) class label matrix into NMF. We develop multiplicative updates for SSNMF to minimize a sum of weighted residuals, each of which involves the nonnegative 2-factor decomposition of the data matrix or the label matrix, sharing a common factor matrix. Experiments on document datasets and EEG datasets in BCI competition confirm that our method improves clustering as well as classification performance, compared to the standard NMF, stressing that semi-supervised NMF yields semi-supervised feature extraction. 相似文献
13.
针对实际监控场景中经常遇到的人脸图像分辨率较低的问题,本文提出了一种利用耦合非负矩阵分解并保持系数松弛的低分辨率人脸识别算法(Relaxed Coupled Nonnegative Matrix Factorization,后文简称RCNMF)。首先,对高低分辨率人脸图像进行非负矩阵矩阵分解(nonnegative matrix factorization,后文简称NMF),在分解的同时保持组合系数近似一致,从而得到高低分辨率图像的基矩阵。然后,通过低分辨率图像的基矩阵提取训练和测试样本的特征。最后进行识别。实验结果验证了与其他几种基于耦合映射的低分辨率人脸识别方法相比,RCNMF算法的识别性能更好。同时通过实验验证了RCNMF算法的收敛性。 相似文献
14.
Nonnegative Matrix and Tensor Factorization 总被引:4,自引:0,他引:4
In these lecture notes, the authors have outlined several approaches to solve a NMF/NTF problem. The following main conclusions can be drawn: 1) Multiplicative algorithms are not necessary the best approaches for NMF, especially if data representations are not very redundant or sparse. 2) Much better performance can be achieved using the FP-ALS (especially for large-scale problems), IPC, and QN methods. 3) To achieve high performance it is quite important to use the multilayer structure with multistart initialization conditions. 4) To estimate physically meaningful nonnegative components it is often necessary to use some a priori knowledge and impose additional constraints or regularization terms (to control sparsity, boundness, continuity or smoothness of the estimated nonnegative components). 相似文献
15.
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法. 相似文献
16.
从重叠比较严重的混合物三维荧光光谱中恢复单一光谱信号,是光谱解析的难点。考虑到光谱内在的非负性,采用非负矩阵分解的投影梯度和交替最小二乘两种算法,并结合K均值初始化方法,来解析菲、芘、蒽3种芳烃混合物的三维荧光光谱数据,有效避免出现负数的分解结果,提取3种成份的三维荧光光谱,得到计算光谱与对应参考光谱的相似系数均大于0.970。计算结果表明,非负矩阵分解能够克服光谱重叠带来的干扰,有效提取光谱成份,从而实现对菲、芘、蒽的成份识别。其中,交替最小二乘的NMF算法更适合实时在线监测。 相似文献