首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 125 毫秒
1.
基于奇异值分解的低速率波形内插语音编码算法   总被引:8,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

2.
该文提出了一种特征波形提取速率自适应于输入语音帧特性的波形内插编码方案。基于双加权长时预测增益最大原则并利用前向基音判决实现了较为可靠的基音周期估计算法,用基音周期、浊音度和波表面平坦度决定波形提取速率以及SEW(Slowly Evolving Waveform)和REW(Rapidly Evolving Waveform)的更新速率。实验证明,该文提出的波形内插(WI)编码算法相比固定波形提取速率的WI算法在平均码率和计算复杂度上均有一定程度的降低,且合成语音质量明显优于4.8kbps的CELP语音编码算法。  相似文献   

3.
张鹏  鲍长春 《信号处理》2005,21(Z1):160-163
WI编码器中特征波形(CW-Characteristic Waveform)的分解与量化一直是该编码器研究的热点问题.传统的WI编码器将残差信号表示为渐变的特征波形,然后通过线性相位非因果FIR低通滤波器把CW分解为慢渐变波形和快渐变波形,分别表示语音的准周期成分和类噪声成分.这种分解方法不仅不能完全去除SEW与REW之间的相关性,而且还增加了额外一帧的延时,本文通过对现有的基于奇异值分解(SVD-Singular Value Decomposition)的特征波形分解方法的研究,深入剖析了CW奇异值分解后U、∑和V的物理意义,并提出一种有效降低SVD复杂度的算法.  相似文献   

4.
基于非负矩阵分解的2kb/s波形内插语音编码算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张鹏  鲍长春  郭莉莉 《电子学报》2008,36(4):632-638
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器.  相似文献   

5.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

6.
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法   总被引:3,自引:1,他引:2       下载免费PDF全文
郭莉莉  鲍长春 《电子学报》2009,37(5):1146-1153
 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Characteristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW 的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当.  相似文献   

7.
基于小波变换的2.4kbit/s波形内插语音编码算法   总被引:1,自引:0,他引:1  
王晶  匡镜明  谢湘 《通信学报》2007,28(5):43-48
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。  相似文献   

8.
提出了一种结合MBE(多带激励)模型和LPC(线性预测编码)模型的1.8kbps声码器.在这种声码器中,采用LPC特征参数来代表语音帧的频谱,利用LPC残差进行基音提取和多带清浊音判决,采用MBE模型合成语音,并在高频浊音带的语音合成中混以清音.在定点Mo-torola DSP56002 EVM上,可以在1.8kbps的码率下对语音进行实时的编解码处理,具有存储量和计算量较小的特点.其合成语音质量超过了LPC-10e.  相似文献   

9.
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e.  相似文献   

10.
WI语音编码中相位信息的量化与重建   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《信号处理》2005,21(1):164-167
在低比特率语音编码中,人们往往认为人耳对相位信息不敏感而忽略了相位对语音质量的影响,导致语音粗糙、刺耳甚至音调发生改变.为了获得高质量的声码器,语音的相位信息是不能不考虑的.本文分析了一种利用感觉加权的相位谱分析合成(A-b-S)矢量量化方法,并在波形内插编码器中对SEW的相位信息进行量化,在合成端采用相位的三次多项式插值方法进行重建.实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度.主观A/B测试结果显示,该方法相比采用老年男子的固定相位法和基于最小相位模型的由幅度谱通过倒谱法重建相位谱的方法,经4~6个比特的相位量化可使合成语音质量得到显著的改善,尤其对女声,改善更为明显.  相似文献   

11.
一种2.4kbps波形插值声码器   总被引:2,自引:0,他引:2  
杨慧敏  陈弘毅  孙义和  吴历曦 《电子学报》1998,26(11):110-113,106
本文描述了波形插值语音分析与合成方法的基本原理和编码技术,并给出一种2.4kbps波形插值声码器的实际结构,该声码器利用提取特征波形及浊/清音成分分离的方法,有效地去除了残差信号中基音波形的冗余度,能在2.4kbps数据率下获得高质量的合成语音。  相似文献   

12.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

13.
在分析具有增幅速率选择特性的连续波多谱勒引信工作原理的基础上,采用理论分析和仿真实验相结合的方式对该种引信的干扰波形进行研究,通过仿真实验效果来确定最佳干扰波形和设计波形参数。  相似文献   

14.
为了解决相位编码准连续波雷达的回波遮挡问题,首先引入遮挡率函数和遮挡情况下的回波主旁瓣比定量分析回波遮挡。在此基础上提出一种基于MAC(Multimode Arbitrary Code)序列的长短脉冲结合的波形设计方法,并给出了基于此方法的波形设计实例和相应的仿真分析。仿真结果表明该波形设计方法能够有效解决相位编码准连续波雷达的回波遮挡问题,实现远近目标的同时探测。  相似文献   

15.
王晶  匡镜明  赵胜辉 《信号处理》2007,23(5):755-758
本文将自适应后滤波技术引入3kbps特征波形内插语音编码算法中,在解码端级联短时后滤波、频谱倾斜补偿、长时后滤波及自动增益控制四个模块。通过理论分析及主观听音测试来合理设置滤波系数,使其随着语音帧的特性自适应改变。经后滤波处理的输出语音信号频谱在共振峰及谐波处频率成分得到加强,而谱谷值处噪声被削弱,同时保证了滤波前后的信号能量基本保持不变,且不引入频谱倾斜。实验结果表明,本文的3kbps波形内插编码器合成语音经过自适应后滤波处理后量化噪声明显减少,语音质量得到改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号