首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
基于MELP设计了一种300bps声码器。该声码器将8个语音帧组成一个超级帧。子带清浊音、基音周期、短时能量三项参数采用8帧联合的方式进行矢量量化,线谱频率采用4帧联合的方式进行多级矢量量化。通过概率统计的方法得到子带清浊音的量化码本,并利用清浊音信息与其他参数的相关性将编解码分为不同的模式,从而改善量化性能。采用加权的欧氏距离度量基音周期和线谱频率的失真度,以提高合成语音的自然度。合成语音的PESQMOS分数为2.096。  相似文献   

2.
针对极低速率语音通信的要求,提出了一种基于MELP(Mixed-Excitation Linear Prediction)的0.6Kb/s语音编码算法。把MELP算法中3个连续语音帧组成一个超级帧,充分利用参数的帧间相关性,进行联合量化,从而获得了高质量的合成语音。采用对线谱对频率的两帧联合量化与双向预测矢量量化对基音周期的按清浊音分模式量化,对子带清浊参数量化的统计码本构造,对能量参数采用分离均值矢量量化解码端对能量参数采用了一种效果更好的插值算法等。  相似文献   

3.
基于局部余弦变换的低比特变速率语音编码算法研究   总被引:1,自引:0,他引:1  
提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。  相似文献   

4.
提出了基于正弦激励的4.0Kb/s低复杂度语音编码算法。该算法对线谱对参数采用带帧间预测技术的全局最优标量量化,在保证语音质量和编码速率的同时,降低了算法所需的存储量和运算量。同时,分子帧的能量参数和清浊音参数提取,更精确地描述了语音变化的特征。分数基音周期的提出对精确刻画语音声调有很大益处。最后激励谱参数的多级矢量量化很好地弥补了正弦激励算法在语音自然度上的缺失。测试结果表明,此算法的非正式主观MOS分达到了3.5,语音质量与AMR4.75Kb/s相当.同时其存储量和运算量大大低于基于CELP的4.0Kb/s左右速率语音编码算法。  相似文献   

5.
唐昆  崔慧娟 《电子学报》1999,27(10):22-26
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法,在线性预测(LP)参数量化上,利用了语音帧内帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率,在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低运算量,对于 机码本,采用了具有多模结构的代数码本  相似文献   

6.
基于DCT变换的LSF参数降维算法   总被引:2,自引:1,他引:1  
为降低声码器线谱对频率(LSF)参数量化码本的存储量和码本搜索运算量,文章提出了一种基于二维DCT变换的LSF参数降维算法.相比时域重要帧抽取算法,DCT降维算法能够在不降低语音听觉性能的基础上,将LSF参数的码本量和搜索运算量都降到50%.在同等情况下,DCT降维算法能比时域重要帧抽取算法提高0.1dB到0.2dB的性能.实验结果表明,提出的算法可以更有效地解决低速率声码器中参数码本存储量和搜索运算量的问题.  相似文献   

7.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短,合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法.在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9.  相似文献   

8.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9.  相似文献   

9.
基于增强型混合激励线性预测(MELPe)模型,设计了一款600bps低速率语音编码器。该编码器在保持MELPe算法特征的同时,利用相邻帧的帧间冗余,把连续的三帧构成一个超帧,对超帧采用多模式预测和多级矩阵量化技术进行联合量化。同时针对超帧的不同模式,通过预测系数对相邻超帧的模式转换进行处理,实现线谱对参数(LSF)的矢量量化。最后对基音周期与增益参数进行联合量化,进一步提高量化效率,完成一款在600bps下仍具有较好合成语音质量的语音编码器的设计。  相似文献   

10.
文中研究了一种基于MELP模型的0.6 kb·s-1语音编码算法,该算法将四子帧组成一个超帧,并根据各子帧的清/浊属性,划分超帧为多个模式,不同的模式采用不同的量化联合编码方案.并在TMS320C5416上实时实现了该声码器算法,合成语音清晰可懂,具有较好的自然度.  相似文献   

11.
新一代视频编码标准H.266/VVC引入分量间线性模型(CCLM)预测提高压缩效率。针对亮度色度分量存在相关性却难以建模的问题,提出基于神经网络的分量间预测算法。该算法根据待预测像素与参考像素的亮度差遴选出相关性强的参考像素构成参考子集,然后将参考子集送入轻量级全连接网络获得色度预测值。实验结果表明,与H.266/VVC测试模型版本10.0(VTM10.0)相比,所提算法可提高色度预测准确度,在Y、Cb和Cr上可分别节省0.27%、1.54%和1.84%的码率。所提算法具有不同块尺寸和编码参数均可使用统一网络结构的优点。  相似文献   

12.
新一代视频编码标准H.266/VVC引入分量间线性模型(CCLM)预测提高压缩效率。针对亮度色度分量存在相关性却难以建模的问题,提出基于神经网络的分量间预测算法。该算法根据待预测像素与参考像素的亮度差遴选出相关性强的参考像素构成参考子集,然后将参考子集送入轻量级全连接网络获得色度预测值。实验结果表明,与H.266/VVC测试模型版本10.0(VTM10.0)相比,所提算法可提高色度预测准确度,在Y、Cb和Cr上可分别节省0.27%、1.54%和1.84%的码率。所提算法具有不同块尺寸和编码参数均可使用统一网络结构的优点。  相似文献   

13.
针对无人机空地信道,基于空间期望最大化算法(SAGE)对信道特征参数进行高精确度估计。在提取了多径时延、多径功率等空地信道小尺度衰落特征后,利用均匀量化和非均匀量化方法,对实测数据的主径功率、主径-多径功率差开展无线信道密钥量化。分别针对起飞和巡航场景分析了密钥的量化效率、随机性以及算法运行时间等指标,并与基于大尺度特征的密钥量化结果进行比较。密钥量化效率结果表明:基于非均匀量化优于均匀量化;基于信道特征高精确度估计的量化方法优于传统基于大尺度特征的量化;起飞场景下的量化优于巡航场景的量化。密钥随机性测试结果表明本次量化所获得的密钥都具有较好的随机性;算法运行时间结果则表明不同量化方法的运行时间差异较小。因此基于高精确度提取的2种量化方法复杂度较低。  相似文献   

14.
主要针对H.264/AVC编码器硬件实现时的特点,提出了一种适合硬件实现的高效码率控制方案。为了提高数据处理效率,硬件编码器通常采用Zigzag宏块编码顺序和宏块级流水结构,两者结合会产生复杂的数据依赖关系。在数据依赖存在的条件下,提出了利用时域和空域相关性预测帧级和宏块级平均绝对误差(MAD),提高预测精度获取合适的量化参数。实验结果显示与G012算法相比,该算法提高了MAD预测精度,平均PSNR提高了0.12 dB,解决了硬件实现时的数据依赖问题。  相似文献   

15.
In visual perception, human only perceive discrete-scale quality levels over a wide range of coding bitrate. More clearly, the videos compressed with a series of quantization parameters (QPs) only have limited perceived quality levels. In this paper, perceptual quantization is transformed into the problem of how to determine the just perceived QP for each quality level, and a just noticeable coding distortion (JNCD) based perceptual quantization scheme is proposed. Specifically, multiple visual masking effects are analyzed and a linear regression (LR) based JNCD model is proposed to predict JNCD thresholds for all quality levels at first. According to the JNCD prediction model, the frame-level perceptual QPs for all quality levels are then derived on the premise of that coding distortions are infinitely close to the predicted JNCD thresholds. Based on the predicted frame-level perceptual QPs, the perceived QPs of all quality levels for each coding unit (CU) are finally determined according to a perceptual modulation function. Experimental results show that the proposed quality-wise perceptual quantization scheme is superior to the existing perceptual video coding algorithms significantly, i.e., the proposed perceptual quantization could save more bitrate with better quality.  相似文献   

16.
低速率声码器中残差谱的变维矢量量化   总被引:3,自引:0,他引:3  
基于一个基音周期内语音线性预测残差波形,提出了一种简单而有效的LPR谱变维矢量量化(VDVQ)方法,即利用具有固定维数的通用码本对LPR谱幅度形状进行了矢量量化,通用码本和结构化的VQ相组合减少了存储和计算复杂度,产生了高的量化效率,增强了编码语音的感怀质量计算机仿真结果表明,利用该VDVQ技术设计的2.4kb/s语音编码器产生了高质量合成语音。  相似文献   

17.
A motion picture coding algorithm using motion-compensated interframe prediction and the adaptive discrete cosine transform (DCT) encoding technique is proposed. High coding efficiency is obtained by the adaptive DCT encoding technique in which encoding parameters are fitted to widely varying characteristics of the interframe differential signal. Segmented DCT subblocks of interframe prediction error are classified into categories based on their coefficient power distribution characteristics. The adaptation gain results from using a suitable variable word length code set designated by the above classification for encoding each quantization index of DCT coefficients. In addition, a new coding parameter control method is introduced based on the information rate estimation of the current frame. This classification promotes high stability because good estimation accuracy of bits consumption for each DCT subblock is obtained by utilizing the category indexes. Simulation results show that the proposed algorithm has enough coding efficiency to transmit videoconferencing motion pictures through a 384 kbit/s channel.  相似文献   

18.
宽带ISF参数的非等系数帧间预测分裂矢量量化方法   总被引:1,自引:0,他引:1  
李海婷  鲍长春 《电子学报》2008,36(6):1214-1217
 本文提出了一种新的适用于宽带语音编码ISF参数量化的非等系数帧间预测分裂矢量量化方案.该量化方案利用ISF参数的帧间相关性,基于预测分裂矢量量化原理,首先对待量化的ISF参数矢量进行去均值和非等系数帧间预测,然后对去均值后的ISF参数的预测残差进行分裂矢量量化.实验表明,该算法在每帧编码比特数为46bits时达到了透明量化,且平均谱失真比G.722.2中ISF参数量化的平均谱失真小.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号