首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 265 毫秒
1.
朱娜娜  鲍长春  李靓 《通信学报》2004,25(11):70-76
基于传统的波形内插语音编码模型,提出了一种新的2kbit/s语音编码方案。该方案在编码端去除了传统方法中复杂的对齐运算,在译码端用三次B样条插值取代传统的线性插值。慢渐变波形只量化低频分量,而快渐变波形用正交多项式拟合,并采用合成-分析技术对其进行矢量量化。DRT测试结果表明,该2kbit/s语音编码方法能获得高可懂度的重建语音。  相似文献   

2.
基于小波变换的2.4kbit/s波形内插语音编码算法   总被引:1,自引:0,他引:1  
王晶  匡镜明  谢湘 《通信学报》2007,28(5):43-48
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。  相似文献   

3.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

4.
一种谐波正弦语音模型的最佳相位估计算法   总被引:1,自引:0,他引:1  
应娜  赵晓晖  董婧  方昕 《电子学报》2009,37(4):860-863
 基于谐波正弦语音模型(HSSM),利用最小二乘方法估计语音模型的最佳相位参数,给出了一种估计相位的批处理方法和迭代算法.把利用该算法得到的相位参数用于宽带语音编解码算法进行仿真,其结果与G.722.2标准宽带编码算法中的两种编码速率8.85kbit/s及6.60kbit/s的语音进行了比较,语音波形的比较和主客观测试结果表明该最佳相位估计算法相位参数估计准确有效,可由此建立的语音模型获得较高质量的合成语音.  相似文献   

5.
混合激励线性预测低速率语音编码研究   总被引:1,自引:0,他引:1  
为了满足数字通信及其他商业应用的需求,语音压缩编码技术得到迅速发展.近年来主流的低速率语音编码方案主要基于LPC-10,混合激励线性预测(MELP),多带激励编码(MBE),正弦变换编码(SCI),波形内插编码(WI),大多都工作在2.4 kb/s速率下.作为一种重要的低速率语音编码算法,MELP算法对LPC-10编码方案进行大量改进,引入混合激励,非周期脉冲,残差付氏幅度谱,脉冲散布和自适应谱滤波5个特征.实验结果表明,该混合激励线性预测编码在2.4 kb/s上得到了更好的合成语音,并使得合成语音能更好地拟合自然语音.  相似文献   

6.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

7.
该文给出了一种改进的2.4kb/s多带激励线性预测(IMBELP)语音编码算法。与传统的MBELP算法相比,本算法在基音提取和清/浊音判决上采取了一些改进措施,使得合成语音质量有一定的提高。本文详细介绍了改进后的MBELP算法,并将其在基音提取和清/浊音判决的结果与传统的MBELP进行比较。  相似文献   

8.
该文提出了一种特征波形提取速率自适应于输入语音帧特性的波形内插编码方案。基于双加权长时预测增益最大原则并利用前向基音判决实现了较为可靠的基音周期估计算法,用基音周期、浊音度和波表面平坦度决定波形提取速率以及SEW(Slowly Evolving Waveform)和REW(Rapidly Evolving Waveform)的更新速率。实验证明,该文提出的波形内插(WI)编码算法相比固定波形提取速率的WI算法在平均码率和计算复杂度上均有一定程度的降低,且合成语音质量明显优于4.8kbps的CELP语音编码算法。  相似文献   

9.
高质量鲁棒600BPS甚低速率语音编码算法   总被引:3,自引:0,他引:3  
邹霞  陈亮  张雄伟 《信号处理》2003,19(Z1):109-112
本文提出了一种600bps高质量鲁棒语音编码算法,该算法采用多帧参数分类联合矢量量化、动态比特分配、参数内插和参数相关预测等技术降低语音编码速率.为了提高算法的抗信道误码能力,算法采用了鲁棒的矢量量化.非正式主观试听表明该算法的合成语音质量优于传统的2.4kbps线性预测(LPC-l0e)语音编码算法,接近于2.4kbps的MELP,并且该算法在1%的随机误码信道条件下仍然具有良好的可懂度.  相似文献   

10.
王贵平  鲍长春 《信号处理》2005,21(Z1):156-159
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文在波形内插语音编码算法基础上,提出了一种基于奇异值分解(SVD)的LP残差信号的分解与量化方法,减少了算法的延时,提高了分解精度.在分解模型中,将CW分成基本矩阵、过渡矩阵和补充矩阵,并采用不同的量化方法,有效地降低了运算复杂度;在量化过程中,引入周期因子和能量熵来衡量CW周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbpsSVD-WI编码器的重建语音质量略好于2.4kbpsMELP编码器.  相似文献   

11.
Hybrid coding of speech has been proposed to overcome the limitations of a single model in representing the wide variety of characteristics of human speech. A new hybrid coding algorithm, which combines harmonic and analysis by synthesis coding techniques, is presented. To integrate the harmonic and analysis by synthesis coders, novel phase synchronisation and speech classification techniques are developed. The perceptual quality of the speech synthesised using the unquantised hybrid model is almost indistinguishable when compared with 128 kbit/s linear PCM. Two variable rate coders are developed based on the designed hybrid model, by quantising the parameters at different bit rates. Subjective listening tests show that the speech quality of the variable rate hybrid coders outperform the quality of 5.3 kbit/s and 6.3 kbit/s ITU G.723.1 coders, at maximum bit rates of 4 kbit/s and 6 kbit/s respectively.  相似文献   

12.
A novel frame interpolation technique for two-band linear predictive coding (LPC) vocoders is proposed for maintaining natural speech quality at bit rates below 1 kbit/s. Experimental results show that the speech quality of the proposed vocoder is quite natural at bit rates 880 bit/s and comparable to that of 4.8 kbit/s CELP  相似文献   

13.
徐志军  王晓军 《数字通信》1998,25(3):15-16,27
设计了一种可变速率的低时延、码激励线性预测编码(LD-CELP)的方案,它是通过修改码本来实现的。该方案工作在11.2kbit/s。对其做了计算机仿真,并与16kbit/s的LD-CELP算法在信经(SNR)、波形等方面进行了对比,仿真结果表明效果良好。  相似文献   

14.
A coding algorithm is presented which combines pitch prediction with low-dimensional vector quantisation to exploit both long- and short-term correlation in the speech waveform at rates of 16 and 9.6 kbit/s. Vector quantisation of the predictor enables the stability of the synthesis filter to be assured, and also allows the use of a minimum residual energy criterion. SNRs of 17-19 dB are achieved at 16 kbit/s and 13-15 dB at 9.6 kbit/s.<>  相似文献   

15.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

16.
刘斌  陶建华  莫福源 《信号处理》2013,29(9):1134-1141
提出了一种面向窄带通信的极低速率参数语音编码算法。在2.4kbps MELP标准的基础上结合听觉感知,对线谱对参数进行联合矢量量化、对基音周期进行内插和非线性量化、对能量参数进行高效压缩,可以使语音数据在0.5kbps下匀速传输;线谱对参数的预测残差用于矢量量化,这是一种提高合成语音的音质的有效方法。实验结果表明,采用本文提出的语音编码算法可以使语音数据在极低码率下有效的传输,解码端合成的语音具有较高的可懂度。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号