首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到13条相似文献,搜索用时 62 毫秒
1.
由于传统特征波形内插语音编码算法对特征波形相位信息的忽略,以及对特征波形的整体对齐,往往造成语音高频谐波分量丢失,从而导致语音的噪声感。为了提高合成语音的质量,该文引入语音多带清浊音标志,并以此为依据对波形内插编码模型中的慢渐变波形和快渐变波形的相位谱进行估计,在语音合成时则对特征波形采取部分对齐的方法,最后提出了一种基于多带的2.4 kbit/s特征波形内插算法。与传统算法相比,新算法明显提高了语音的清晰度。与标准2.4 kbit/sMELP算法相比,该算法合成语音质量亦略显优势。  相似文献   

2.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

3.
基于非负矩阵分解的2kb/s波形内插语音编码算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张鹏  鲍长春  郭莉莉 《电子学报》2008,36(4):632-638
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器.  相似文献   

4.
李靓  王贵平  鲍长春 《通信学报》2005,26(1):95-103
介绍了原型波形内插和特征波形内插算法的基本原理及其实现方法,详细描述了原型波形内插和特征波形内插语音编码技术的研究进展情况,并提出了今后的研究方向。  相似文献   

5.
基于奇异值分解的低速率波形内插语音编码算法   总被引:1,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

6.
朱娜娜  鲍长春  李靓 《通信学报》2004,25(11):70-76
基于传统的波形内插语音编码模型,提出了一种新的2kbit/s语音编码方案。该方案在编码端去除了传统方法中复杂的对齐运算,在译码端用三次B样条插值取代传统的线性插值。慢渐变波形只量化低频分量,而快渐变波形用正交多项式拟合,并采用合成-分析技术对其进行矢量量化。DRT测试结果表明,该2kbit/s语音编码方法能获得高可懂度的重建语音。  相似文献   

7.
浊音语音可以看作是慢变化的基音周期波形的连接。文中介绍的原波形内插算法利用了浊音语音的周期性,每隔20-30ms提取一单个的基音周期波形,然后在更新点处进行内插重建语音信号。用此方法进行语音编码可大大降低编码率。  相似文献   

8.
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法   总被引:2,自引:1,他引:2       下载免费PDF全文
郭莉莉  鲍长春 《电子学报》2009,37(5):1146-1153
 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Characteristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW 的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当.  相似文献   

9.
吴晓冬  李永明 《电子器件》1997,20(1):350-353
本文将小波变换用于语音压缩,给出了有关算法和结果。这一算法适用于各类语单甚至音乐信号,有助于实现低码率声音编码。  相似文献   

10.
基于M-频带小波变换的宽带语音编码算法   总被引:1,自引:0,他引:1  
任何能量有限信号可以用M-频带紧支撑正交小波基展开,这有助于研究快速信号处理算法和高效编码算法。本文设计了一种基于M-频带正交小波变换的宽带语音编码算法,该算法语音质量好,编码时延小。  相似文献   

11.
陆亮  楼剑  虞露  董洁 《电路与系统学报》2005,10(6):59-62,68
小波变换中高低分辨率子带之间的相似性使得利用小波变换进行图像插值的方法成为可能.根据数字图像信号的特点,分析了小波变化后各个子带信号的特点,提出了基于整数小波变换的Wiener插值算法.用Wiener自适应滤波器训练得到插值滤波系数,同时结合既符合图像性质又能减小运算量的整数双正交小波基对图像插值.结果得到较高的信噪比和较好的主观视觉效果.平均峰值信噪比比传统的双线性插值法提升了2.4dB.  相似文献   

12.
语音特征波形的分解与量化   总被引:1,自引:0,他引:1  
王贵平  鲍长春  李靓 《电声技术》2005,(1):50-54,58
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视。基于波形内插(WI)语音编码算法,全面总结和分析了现存的特征波形分解和量化的方法,这将为该领域的研究人员提供重要的参考。  相似文献   

13.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号