首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
基于非负矩阵分解的2kb/s波形内插语音编码算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张鹏  鲍长春  郭莉莉 《电子学报》2008,36(4):632-638
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器.  相似文献   

2.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

3.
王贵平  鲍长春 《信号处理》2005,21(Z1):156-159
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文在波形内插语音编码算法基础上,提出了一种基于奇异值分解(SVD)的LP残差信号的分解与量化方法,减少了算法的延时,提高了分解精度.在分解模型中,将CW分成基本矩阵、过渡矩阵和补充矩阵,并采用不同的量化方法,有效地降低了运算复杂度;在量化过程中,引入周期因子和能量熵来衡量CW周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbpsSVD-WI编码器的重建语音质量略好于2.4kbpsMELP编码器.  相似文献   

4.
基于奇异值分解的低速率波形内插语音编码算法   总被引:8,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

5.
张鹏  鲍长春 《信号处理》2005,21(Z1):160-163
WI编码器中特征波形(CW-Characteristic Waveform)的分解与量化一直是该编码器研究的热点问题.传统的WI编码器将残差信号表示为渐变的特征波形,然后通过线性相位非因果FIR低通滤波器把CW分解为慢渐变波形和快渐变波形,分别表示语音的准周期成分和类噪声成分.这种分解方法不仅不能完全去除SEW与REW之间的相关性,而且还增加了额外一帧的延时,本文通过对现有的基于奇异值分解(SVD-Singular Value Decomposition)的特征波形分解方法的研究,深入剖析了CW奇异值分解后U、∑和V的物理意义,并提出一种有效降低SVD复杂度的算法.  相似文献   

6.
基于小波变换的2.4kbit/s波形内插语音编码算法   总被引:1,自引:0,他引:1  
王晶  匡镜明  谢湘 《通信学报》2007,28(5):43-48
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。  相似文献   

7.
高质量的4 kb/s散布脉冲CELP语音编码算法   总被引:11,自引:0,他引:11  
鲍长春 《电子学报》2003,31(2):309-313
本文提出了一种散布脉冲CELP(DP-CELP)语音编码算法,激励矢量由特殊结构的代数码书与固定形式的散布脉冲的卷积获得,这种激励源有效地改善了重建语音质量,但未增加代数码书搜索的复杂度.非正式的主观听力测试表明,这种4 kb/s DP-CELP语音编码算法的合成语音质量非常接近G.723.1中6.3 kb/s语音编码器.  相似文献   

8.
由于传统特征波形内插语音编码算法对特征波形相位信息的忽略,以及对特征波形的整体对齐,往往造成语音高频谐波分量丢失,从而导致语音的噪声感。为了提高合成语音的质量,该文引入语音多带清浊音标志,并以此为依据对波形内插编码模型中的慢渐变波形和快渐变波形的相位谱进行估计,在语音合成时则对特征波形采取部分对齐的方法,最后提出了一种基于多带的2.4 kbit/s特征波形内插算法。与传统算法相比,新算法明显提高了语音的清晰度。与标准2.4 kbit/sMELP算法相比,该算法合成语音质量亦略显优势。  相似文献   

9.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

10.
WI语音编码中相位信息的量化与重建   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《信号处理》2005,21(1):164-167
在低比特率语音编码中,人们往往认为人耳对相位信息不敏感而忽略了相位对语音质量的影响,导致语音粗糙、刺耳甚至音调发生改变.为了获得高质量的声码器,语音的相位信息是不能不考虑的.本文分析了一种利用感觉加权的相位谱分析合成(A-b-S)矢量量化方法,并在波形内插编码器中对SEW的相位信息进行量化,在合成端采用相位的三次多项式插值方法进行重建.实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度.主观A/B测试结果显示,该方法相比采用老年男子的固定相位法和基于最小相位模型的由幅度谱通过倒谱法重建相位谱的方法,经4~6个比特的相位量化可使合成语音质量得到显著的改善,尤其对女声,改善更为明显.  相似文献   

11.
传统非负矩阵分解方法仅基于单层线性模型,现有的深度非负矩阵分解模型忽略了地物光谱的实际混合物理过程,仅从数学理论考虑深度分解。对此,文中从光谱混合的物理过程出发,综合非负矩阵分解和深度学习,将光谱混合过程进行反向建模,并充分考虑丰度的稀疏性和空间平滑性,构建了用于高光谱遥感影像解混的面向端元矩阵的全变差稀疏约束深度非负矩阵分解模型。通过模拟实验和真实实验,将文中所提方法与5种解混方法进行对比。结果表明,相较于面向丰度的深度非负矩阵分解算法,文中所提方法的平均光谱角距离和均方根误差均有所降低,取得了最佳解混结果。  相似文献   

12.
约束非负矩阵分解是高光谱图像解混中常用的方法.该方法的求解通常采用投影梯度法,其收敛速度、求解精度和算法稳定性都有待提高.为此,本文针对较优的最小体积约束,提出一种基于约束非负矩阵分解的高光谱图像解混快速算法.首先优化原有的最小体积约束模型,然后设计了基于交替方向乘子法的非凸项约束非负矩阵分解算法,最后通过奇异值分解优化迭代步骤.模拟和实际数据实验结果验证了本文算法的有效性.  相似文献   

13.
An incremental subspace learning scheme to recover lost speech segments online is presented. Our contributions in this work are twofold. First, the recovery problem is transformed into an interpolation problem of the time‐varying gains via nonnegative matrix factorization. Second, incremental nonnegative matrix factorization is employed to allow online processing and track the evolution of speech statistics. The effectiveness of the proposed scheme is confirmed by the experiment results.  相似文献   

14.
To address problems that the effectiveness of feature learned from real noisy data by classical nonnegative matrix factorization method,a novel sparsity induced manifold regularized convex nonnegative matrix factorization algorithm (SGCNMF) was proposed.Based on manifold regularization,the L2,1norm was introduced to the basis matrix of low dimensional subspace as sparse constraint.The multiplicative update rules were given and the convergence of the algorithm was analyzed.Clustering experiment was designed to verify the effectiveness of learned features within various of noisy environments.The empirical study based on K-means clustering shows that the sparse constraint reduces the representation of noisy features and the new method is better than the 8 similar algorithms with stronger robustness to a variable extent.  相似文献   

15.
不完全非负矩阵分解的加速算法   总被引:5,自引:0,他引:5       下载免费PDF全文
非负矩阵分解(NMF)已成为数据分析与处理的一种日益流行的方法.当数据矩阵不完全时,可用加权非负矩阵分解(WNMF)来分解矩阵.但是在WNMF算法中,对于给定的搜索方向,步长的选取一般来说不是最优的.本文研究了不完全非负矩阵分解(INMF)问题,提出了加速算法(AINMF).首先,将INMF问题转化为交替地求解两个非负...  相似文献   

16.
王超  赵阳  裴继红 《信号处理》2020,36(7):1127-1135
针对实际监控场景中经常遇到的人脸图像分辨率较低的问题,本文提出了一种利用耦合非负矩阵分解并保持系数松弛的低分辨率人脸识别算法(Relaxed Coupled Nonnegative Matrix Factorization,后文简称RCNMF)。首先,对高低分辨率人脸图像进行非负矩阵矩阵分解(nonnegative matrix factorization,后文简称NMF),在分解的同时保持组合系数近似一致,从而得到高低分辨率图像的基矩阵。然后,通过低分辨率图像的基矩阵提取训练和测试样本的特征。最后进行识别。实验结果验证了与其他几种基于耦合映射的低分辨率人脸识别方法相比,RCNMF算法的识别性能更好。同时通过实验验证了RCNMF算法的收敛性。   相似文献   

17.
Efficient clustering and categorizing of video are becoming more and more vital in various applications including video summarization, content-based representation and so on. The large volume of video data is the biggest challenge that this task presents, for most the clustering techniques suffer from high dimensional data in terms of both accuracy and efficiency. In addition to this, most video applications require online processing; therefore, clustering should also be done online for such tasks. This paper presents an online video scene clustering/segmentation method that is based on incremental nonnegative matrix factorization (INMF), which has been shown to be a powerful content representation tool for high dimensional data. The proposed algorithm (Comp-INMF) enables online representation of video content and increases efficiency significantly by integrating a competitive learning scheme into INMF. It brings a systematic solution to the issue of rank selection in nonnegative matrix factorization, which is equivalent to specifying the number of clusters. The clustering performance is evaluated by tests on TRECVID video sequences, and a performance comparison to baseline methods including Adaptive Resonance Theory (ART) is provided in order to demonstrate the efficiency and efficacy of the proposed video clustering scheme. Clustering performance reported in terms of recall, precision and F1 measures shows that the labeling accuracy of the algorithm is notable, especially at edit effect regions that constitute a challenging point in video analysis.  相似文献   

18.
针对现有的在线社团检测方法大多仅从增量相关的节点和边出发,难以有效挖掘社团结构的动态变化特性问题,提出了一种基于图流在线非负矩阵分解的社团检测方法.首先将网络中持续到达的图数据按照流式数据进行存储和预处理,然后借鉴梯度下降思想,采用在线非负矩阵分解架构,根据不同时刻达到的图流序列,实时迭代更新社团归属矩阵,并通过有效的学习率和缓存策略设置,保证了图流处理的收敛性和合理性.实验结果表明,相比于已有在线社团检测方法,该方法具备更高的社团检测精度.  相似文献   

19.
为了克服红外可见光图像融合方法存在的不足,结合快速有限剪切波变换(Fast Finite Shearlet Transform,FFST)的平移不变性以及较高的方向敏感性,提出了一种基于快速有限剪切波变换域的自适应多方向图像融合新方法。首先,对严格配准后的图像进行快速有限剪切波变换分解,得到低频子带和高频子带系数;然后,对低频子带系数采用非负矩阵分解的一个约束稀疏算法,即在基本非负矩阵分解的优化函数中施加稀疏性约束,使分解更优,以此来提高重构后图像的清晰度;高频子带系数则采用联合方向特性的对比度进行选取,以得到丰富的细节信息。最后,利用快速有限剪切波逆变换得到重构后的图像。实验结果表明,融合后的图像充分结合了源图像的有用信息,整体轮廓清晰,在客观评价上也有一定的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号