首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
提出了语音谱参数的切换双预测多级矢量量化算法(DPMSVQ) 的码本设计方法。这种改进的多级矢量量化方法充分利用语音谱参数的短时相关和长时相关特性,采用了有记忆的多级矢量量化算法(MSVQ);并且通过利用相邻语音帧间语音谱参数的强相关和弱相关的不同特点,采用了分别对应于强相关和弱相关的两个预测值,进一步减小了语音谱参数编码位率。切换双预测多级矢量量化方法能够实现21位的语音谱参数近似“透明”量化,同时能够使语音谱参数量化时的计算复杂度略有减少,所需的存储空间大为减少。  相似文献   

2.
线谱对参数预测多级矢量量化联合优化算法   总被引:1,自引:0,他引:1  
提出了一种线谱对参数预测多级矢量量化联合优化算法.该算法对预测系数和多级矢量量化采用渐进闭环设计,通过迭代实现预测系数和多级矢量量化设计的联合优化.在多级矢量量化设计过程中,采用迭代优化实现多级码本的联合优化.采用语音线谱对参数对量化算法进行测试.测试结果表明,与传统算法相比,该量化算法可以减小线谱对参数量化失真.提高编码语音质量.  相似文献   

3.
为了降低宽带导抗谱频率(ISF)参数矢量量化器的运算复杂度和存储空间,提出了一种随机矢量-高斯格型矢量两级矢量量化模型,研究了量化模型的联合量化算法和码本训练算法.基于上述量化模型设计了一种宽带ISF参数预测式两级矢量量化器,量化算法的第一级使用随机矢量量化第二级采用高斯格型矢量量化.实验结果表明,ISF参数预测式两级矢量量化器在45比特/帧可以达到透明量化,相比于ITU-T G.722.2中的分裂-多级矢量量化(S-MSVQ)方法,该方法降低了41.7%的存储空间和3..1%的运算复杂度.  相似文献   

4.
文章提出了一种多级量化LSF参数的方法,并进一步提出了优化量化的方法以及性能分析。优化算法减少了矢量量化算法的运算量和运算时间。加快了矢量量化的编码速度,且对矢量量化的失真情况没有影响。  相似文献   

5.
在混合激励线性预测(MELP)算法的基础上,设计一种1 120 b/s MELP甚低速率语音编码算法。该算法通过增加帧长、动态比特分配和多帧联合矢量量化、及参数内插等方法降低语音的编码速率,并已在TMS320VC5416DSP芯片上实时实现。采用美国GL公司的语音质量评估系统VQT,对编解码的实时语音质量进行评估,语音质量感知评价高于3分。实验结果表明,该算法能够满足实际通信要求。  相似文献   

6.
周汀  陈亮  章倩苓 《计算机学报》1999,22(12):1317-1319
提出一种新的图像矢量量化编码算法。该算法结合相关矢量量化编码算法与地址矢量量化编码算法,首先根据相邻块状态进行编码地址的相关预测,对相关预测失败的图像块采用地址码匹配编码,并采用自适应算术编码进行。测试结果表明,相对于无记忆矢量量化编码算法,比特率约下降38%-68%,相对于安平提出的矢量量化地址编码算法以及王卫等提出的相关矢量量化编码算法,比特率约下降25%以上。  相似文献   

7.
为了提高深度模型的编码重构性能,本文为传统对比散度(Contrastive divergence,CD)添加了基于交叉熵的重构误差约束。利用改进后的算法训练了重构性深度自编码机(Reconstructive deep auto encoder,RDAE),并用RDAE替换混合激励线性预测编码(Mixed excitation linear prediction, MELP)语音编码器中 LSF参数的矢量量化方法。测试结果表明,改进后的算法在损失一定模型似然度的条件下获得了重构性能的提升,当RDAE隐藏层结点设为19 bit时,本文方法所测得的加权LSF距离、重构语音质量、谱失真指标在训练集和测试集上均优于25 bit矢量量化方法,即利用本文方法改进的MELP编码器,在不降低语音质量的条件下,可将MELP编码速率从2.4 kb/s降低至2.1 kb/s,编码速率降低了12.5%。  相似文献   

8.
对基于矢量量化的数字视频压缩技术进行了论述,并根据分析结果提出了一种新的矢量量化算法——多级矢量量化联合编码算法,该算法保持了多级矢量量化算法编码速度快、图像相关性小等特点,同时提高了编码质量。实验表明,该算法与已有的算法相比具有较高的图像质量和更高的压缩率。  相似文献   

9.
讨论了在语音编码中,应用神经网络技术进行矢量量化的算法。神经网络矢量量化算法可以压缩码本维数,提高码本搜索速度,从而优化矢量量化的效果。将这种优化的矢量量化算法应用于语音编码中,能降低运算复杂度,提高编码质量。  相似文献   

10.
矢量量化的编码过程计算复杂性极高,为了减少编码时大量的矢量间距离计算,许多文献提出利用不等式关系以较少的计算量来估算距离的方法。在Chang等人提出的利用双限制三角不等式的快速搜索算法基础上,通过改进参考矢量的选取方法,有效提高了码字搜索的效率。实验结果表明,改进算法的码字排除率可以提高3.735%9.976%,编码时间可以减少6.03%35.25%。  相似文献   

11.
作为一种有损图像编码技术,块截短编码算法(BTC)的计算量较少,速度快,有较好的信道容错力,重建图像质量较高。然而,标准BTC算法的主要缺点是其压缩比特率比其他基于块图像编码的算法(如变换编码和矢量量化)高。为了降低比特率,提出了几种有效的BTC算法,还提出了一种简单的查表算法对每块的BTC量化数据编码,另外还引入了矢量量化技术以减少对位平面编码的比特数。为了减少由改进算法引入的额外失真,在每种提出的算法中,采用最优阈值而不用平均值作为量化阈值。  相似文献   

12.
为了充分利用能量与线性预测编码(Linear prediction coding,LPC)系数之间的相关性,提高能量参数量化效率,提出了一种基于隐马尔可夫模型(Hidden Markov model,HMM)的能量参数预测量化算法.通过适当假设,使用HMM模拟能量参数和LPC系数之间的相关性,其中离散化后的能量参数组成隐状态序列,量化后的LPC系数组成可现测序列.然后利用HMM预测每一超帧中的能量参数的变化轨迹,并根据预测出的能量轨迹对预测残差进行分模式矢量量化(Mode-based vector quantization,MBQ).仿真实验中能量参数量化后的平均失真为2.668 dB,与线性预测量化算法相比下降了14.O%,表明本文算法通过利用能量参数与LPC系数的相关性,能够有效地提高能量参数量化效率.  相似文献   

13.
基于高效视频编码标准的x265编码器根据图像复杂度来分配比特,复杂图像往往包含运动变化较大的高频信息,其时域相关性较弱且消耗较多比特,导致分配给运动变化平缓图像的比特减少,进而影响编码质量且码率波动较大。同时,x265编码器采用独立率失真优化技术编码,忽略了编码单元间在时域上的相关性,进而损失编码性能。针对上述问题,提出一种基于时域依赖的编码树单元级码率控制算法。首先,根据迭代策略寻找最合适的量化参数进行帧级比特分配;其次,建立零延时的失真时域反向传播模型并计算失真影响因子;最后,将失真影响因子用于调整编码单元的拉格朗日乘子及量化参数。实验结果显示,相较于x265-3.6的码率控制算法,平均BD-rate码率节省达到5.6%。  相似文献   

14.
We address the problem of speech compression at very low rates, with the short-term spectrum compressed to less than 20 bits per frame. Current techniques apply structured vector quantization (VQ) to the short-term synthesis filter coefficients to achieve rates of the order of 24 to 26 bits per frame. In this paper we show that temporal correlations in the VQ index stream can be introduced by dynamic codebook ordering, and that these correlations can be exploited by lossless coding approaches to reduce the number of bits per frame of the VQ scheme. The use of lossless coding ensures that no additional distortion is introduced, unlike other interframe techniques. We then detail two constructive algorithms which are able to exploit this redundancy. The first method is a delayed-decision approach, which dynamically adapts the VQ codebook to allow for efficient entropy coding of the index stream. The second is based on a vector subcodebook approach and does not incur any additional delay. Experimental results are presented for both methods to validate the approach.  相似文献   

15.
本文将线谱对(Linear Spectrum Pair,LSP )参数用于语音编码,同时分析比较了LSP与常用的线性预测系数(LPC)和格滤波发射系统(PARCOR)的特征分别,并由此引入更能有效量化线谱对参数的区域量化技术。因此在保证编码后语音MOS指标的同时可以达到进一步降低码率的目的。  相似文献   

16.
In this paper, we focus on quantization-index-modulation (QIM) steganography in low-bit-rate speech codec and contribute to improve its steganalysis resistance. A novel QIM steganography is proposed based on the replacement of quantization index set in linear predictive coding (LPC). In this method, each quantization index set is seen as a point in quantization index space. Steganography is conducted in such space. Comparing with other methods, our algorithm significantly improves the embedding efficiency. One quantization index needs to be changed at most when three binary bits are hidden. The number of alterations introduced by the proposed approach is much lower than that of the current methods with the same embedding rate. Due to the fewer cover changes, the proposed steganography is less detectable. Moreover, a division strategy based on the genetic algorithm is proposed to reduce the additional distortion introduced by replacements. In our experiment, ITU-T G.723.1 is selected as the codec, and the experimental results show that the proposed approach outperforms the state-of-the-art LPC-based approach in low-bit-rate speech codec with respect to both steganographic capacity and steganalysis resistance.  相似文献   

17.
为了克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述中,提出了5维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;介绍了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG);用提取算法提取、建立了浊音隶属度码本的训练样本集,用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器进行语音编、解码仿真;结果表明,用浊音隶属度矢量描述和合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

18.
Mikhael, W., and Krishnan, V., Energy-Based Split Vector Quantizer Employing Signal Representation in Multiple Transform Domains, Digital Signal Processing11 (2001) 359–370Vector quantization schemes are widely used for waveform coding of one- and multidimensional signals. In this contribution, a novel energy-based, split vector quantization technique is presented, which represents digital signals efficiently as measured by the number of bits per sample for a predetermined signal reconstruction quality. In this approach, each signal vector is projected into multiple transform domains. In the learning mode, for a given transform domain representation, the transformed vector is split into subvectors (subbands) of equal average energy estimated from the transformed training vector ensemble. An equal number of bits is assigned to each subvector. A codebook is then designed for each equal energy subband of each transform domain representation. In the running mode, the coder selects codes from the domain that best represents the signal vector. The proposed multiple transform, split vector quantizer is developed and its performance is evaluated for both single-stage and multistage implementations. Several single transform vector quantizers for waveform coding exist, some of which employ energy-based bit allocation. Sample results using one-dimensional speech signals confirm the superior performance of the proposed scheme over existing single transform vector quantizers for waveform coding.  相似文献   

19.
基于快速相关矢量量化的图象编码算法   总被引:7,自引:1,他引:6       下载免费PDF全文
图象编码已经成为当今计算机世界的重要问题,而矢量量化(VQ)又是近年来有损图象压缩的一种重要技术,它的优点是比特率低以及解码简单,但是其穷尽搜索编码计算量较大,为了降低编码时间,已经有多种快速算法出现在一些文献中,然而这些算法往往不能进一步降低比特率,为了解决这一问题,因此提出了一种新颖快速相关矢量量化(CVQ)图象编码算法,该算法对图象块的编码采用对角顺序,即在编码过程中根据当前图象块(CVQ)  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号