首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
朱娜娜  鲍长春  李靓 《通信学报》2004,25(11):70-76
基于传统的波形内插语音编码模型,提出了一种新的2kbit/s语音编码方案。该方案在编码端去除了传统方法中复杂的对齐运算,在译码端用三次B样条插值取代传统的线性插值。慢渐变波形只量化低频分量,而快渐变波形用正交多项式拟合,并采用合成-分析技术对其进行矢量量化。DRT测试结果表明,该2kbit/s语音编码方法能获得高可懂度的重建语音。  相似文献   

2.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

3.
本文将基音周期波形(PCW)在时间方向上逐个相痊对章,提出了一种新的线性预测残差(LPR)域典型波形(PW)提取和块内插方法。该方法可以避免内插后的PCW分界处的不连续而引起的听觉上的失真,同时也使得PW分界的选择不对于太严格。借助于这种PW提取和块内插方法,本文实现了一种2.4kb/s线性预测编码方案,计算机模拟结果表明,该方案得到的重建语音与4.8kb/s码激励线性预测算法接近。  相似文献   

4.
李靓  王贵平  鲍长春 《通信学报》2005,26(1):95-103
介绍了原型波形内插和特征波形内插算法的基本原理及其实现方法,详细描述了原型波形内插和特征波形内插语音编码技术的研究进展情况,并提出了今后的研究方向。  相似文献   

5.
本文将基音周期波形(PCW)在时间方向上逐个相位对齐,提出了一种新的线性预测残差(LPR)域典型波形(PW)提取和块内插方法。该方法可以避免内插后的PCW分界处的不连续而引起的听觉上的失真,同时也使得PW分界的选择不至于太严格。借助于这种PW提取和块内插方法,本文实现了一种2.4 kb/s线性预测编码方案,计算机模拟结果表明,该方案得到的重建语音与4.8 kb/s码激励线性预测算法接近。  相似文献   

6.
浊音语音可以看作是慢变化的基音周期波形的连接。文中介绍的原波形内插算法利用了浊音语音的周期性,每隔20-30ms提取一单个的基音周期波形,然后在更新点处进行内插重建语音信号。用此方法进行语音编码可大大降低编码率。  相似文献   

7.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

8.
语音特征波形的分解与量化   总被引:1,自引:0,他引:1  
王贵平  鲍长春  李靓 《电声技术》2005,(1):50-54,58
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视。基于波形内插(WI)语音编码算法,全面总结和分析了现存的特征波形分解和量化的方法,这将为该领域的研究人员提供重要的参考。  相似文献   

9.
基于小波变换的2.4kbit/s波形内插语音编码算法   总被引:1,自引:0,他引:1  
王晶  匡镜明  谢湘 《通信学报》2007,28(5):43-48
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。  相似文献   

10.
基于非负矩阵分解的2kb/s波形内插语音编码算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张鹏  鲍长春  郭莉莉 《电子学报》2008,36(4):632-638
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器.  相似文献   

11.
本文主要研究语音信号的分段离散Fourier变换(DFT)波形编码。提出新的信号分析工具——非线性DFT,它不仅表征了时间序列的局部线性信息,而且也包含有时间序列的全局大范围的二阶(平方)非线性特征,因此它具有比线性DFT更强的信号分析能力。利用该DFT对一长分段(如,512或者1024个样点)语音信号进行波形编码,在获得较高的压缩比(压缩比为8或16)的情况下,能很好地保持原语音信号波形的细节特征。  相似文献   

12.
基于奇异值分解的低速率波形内插语音编码算法   总被引:1,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

13.
提出了一种波形编码的新方法,阐述了其编码原理。该编码算法简单,恢复的语音质量较好。由于利用了矢量量化技术,所以该编码速率较低。  相似文献   

14.
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法   总被引:2,自引:1,他引:2       下载免费PDF全文
郭莉莉  鲍长春 《电子学报》2009,37(5):1146-1153
 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Characteristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW 的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当.  相似文献   

15.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

16.
Lattice vector quantization(LVQ) has been used for real-time speech and audio coding systems.Compared with conventional vector quantization,LVQ has two main advantages:It has a simple and fast encoding process,and it significantly reduces the amount of memory required.Therefore,LVQ is suitable for use in low-complexity speech and audio coding.In this paper,we describe the basic concepts of LVQ and its advantages over conventional vector quantization.We also describe some LVQ techniques that have been used in speech and audio coding standards of international standards developing organizations(SDOs).  相似文献   

17.
王晶  匡镜明  赵胜辉 《信号处理》2007,23(5):755-758
本文将自适应后滤波技术引入3kbps特征波形内插语音编码算法中,在解码端级联短时后滤波、频谱倾斜补偿、长时后滤波及自动增益控制四个模块。通过理论分析及主观听音测试来合理设置滤波系数,使其随着语音帧的特性自适应改变。经后滤波处理的输出语音信号频谱在共振峰及谐波处频率成分得到加强,而谱谷值处噪声被削弱,同时保证了滤波前后的信号能量基本保持不变,且不引入频谱倾斜。实验结果表明,本文的3kbps波形内插编码器合成语音经过自适应后滤波处理后量化噪声明显减少,语音质量得到改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号