首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
G.729用固定码本和自适应码本构成的激励通过合成滤波器恢复出较高质量的语音信号.由于算法复杂耗时过多,不能在DSP上实时实现,其中固定码本搜索和自适应码本搜索是最复杂的模块.介绍了码本搜索方法并进行了改进,使复杂度大大降低.结果表明语音质量没有明显下降.  相似文献   

2.
 本文提出了一种新的说话人码本的优化设计方法—粒子对协同优化算法,应用于矢量量化的说话人辨认.此算法利用两个初始粒子对分别在每次迭代中执行粒子群优化算法的速度、位置更新和标准LBG算法实现并行搜索最优码本,粒子对由两个粒子构成,每隔一定的迭代次数通过交换粒子实现粒子对间的信息交流,最后分别选出两个较优粒子组成精英粒子对进一步搜索.此算法避免传统LBG算法陷入局部最优的缺点.实验结果表明,本算法始终稳定地取得显著优于LBG、FCM、FRLVQ-FVQ、FEP和PSO算法的说话人辨认性能,较好地解决了初始码本影响优化结果的问题,且在计算时间和收敛速度方面有优势.  相似文献   

3.
数字移动通信近几年来得到长足的发展,而语音低码率编码是其中一项关键技术.本文提出一种脉冲自适应码本激励编码方案.该方案将规则脉冲激励算法和码本激励算法有机地相结合,采用新的有效码本结构,降低码字的维数,提高码字的效率,另外,在最佳激励搜索上采用了脉冲自适应搜索方式,避免了全寻的工作方式,使得码本搜索的计算量大大降低。通过计算机模拟结果表明,该编码方案和美国EIA公布的编码算法相比具有计算量小,所占储存空间少而合成音质几乎不下降等优点.在8Kb/s PACELP能够合成出令人满意的语音质量。而这一切又保证了PACELP算法可以在一块TMS320 C25上实现。  相似文献   

4.
矢量量化(VQ)是语音识别中广泛应用的一种数据压缩和编码方法。在矢量量化的码本设计过程中,经典的LBG算法收敛速度快,但极易陷入局部最优,且初始码本的生成对最佳码本的设计影响很大。考虑到遗传算法(GA)是一种具有全局优化搜索能力的算法,提出了GA和LBG算法相结合的GA L算法来优化码本,改善了码本质量,并将其应用于非特定人汉语连续数字语音识别中。实验结果表明,GA L算法优于传统的LBG算法。  相似文献   

5.
本文讨论了自组织特征映射人工神经网络在语音矢量量化中应用时所涉及的两个重要问题,即码本训练和码本搜索的问题。根据语音反射系数的特点,提出了训练中初始码本的选择原则和实用训练算法。利用特征映射网络的聚类特性和语音相邻帧间的相关性,提出了码本搜索的两种快速算法——子域搜索法和邻域搜索法。大量实验结果表明,这两种快速搜索方法相结合,搜索时间减少为常用的LBG全搜索算法的1/4或1/10,同时保持精度不下降。本文提出的方法已在一种极低数据率的声码器中得到成功应用。  相似文献   

6.
提出一种新的低功耗图像及视频编解码算法。该算法主要基于矢量量化,认为编码算法的质量和功耗地码本尺寸的大小,通过采用小尺寸码本,降低算法所需要的内存数量,从而降低功耗。编码时,利用分形理论中的同构变换计算虚拟码本,弥补由于采用小码本造成的图像质量损失,并使编码过程较少依赖于码本内存。编解码结果与全搜索型矢量量化算法相比,在不损失图像质量的前提下,可以极大地降低编解码功耗。  相似文献   

7.
在粒子群优化(Particle Swarm Optimization, PSO)和混合蛙跳算法(Shuffled Frog-Leaping Algorithm, SFLA)的基础上,该文提出了一种新的混合粒子对优化(Shuffled Particle-Pair Optimizer, SPPO)算法,应用于矢量量化的说话人识别。该算法将全局信息交换和局部深度搜索相结合寻求最佳的说话人码本。群体按适应值分为3个粒子对,每个粒子对由两个粒子构成,按先后顺序执行PSO算法中的速度位置更新和LBG算法以实现局部细致搜索,间隔一定的迭代次数通过SFLA混合策略实现粒子对间的信息交换,从而使群体向全局最优解靠近。实验结果表明,本算法始终稳定地取得显著优于LBG,FCM,FRLVQ-FVQ和PSO算法的说话人识别性能,较好地解决了初始码本影响的识别性能的问题,且在计算时间和收敛速度方面有相当的优势。  相似文献   

8.
ACELP中的码本搜索由于其巨大的运算量,难以在实时系统中实现。为降低计算复杂度,提出了一种通过对初始码本进行预选、对同轨道内脉冲进行组合替换、同时设置合适的初始脉冲对数阀值N的快速码本搜索方法。实验表明,在保证语音品质基本不变的前提下,该方法可使得算法的复杂度降低至传统搜索法的9.7%。  相似文献   

9.
AMR-WB是一个可以在低速时取得很高语音质量的宽带语音编码器,但是当AMR-WB编码算法应用于一些对硬件要求比较苛刻的领域时,其编码的复杂度偏高。固定码本搜索方法在语音编码中占有很大的比例,论文提出了用于AMR-WB语音编码标准的一个新的快速固定码本搜索方法,使其计算量下降了44.3%。  相似文献   

10.
艾红梅  杨行峻 《电子学报》1996,24(12):104-107,59
随机码本是码本激励线性预测CELP声码器的一个重要组成部分,其码本结构及其相应的搜索算法直接影响着语音编译码系统的语音质量和实时实现。本文给出了一个结构化随机码本-“线性移位”高斯码本的一组双向递归计算公式,由此提出了一种单向递归搜索算法,从而有效地降低了随机码本的搜索复杂度,使搜索速度较之参考文献给出的原随机码本搜索法提高1.76倍,为进一步减少码本搜索的运算量,本文还引入了局部搜索的次优化准则  相似文献   

11.
A fast-search method is introduced to reduce the searching range of a codebook using the ordering property of LSF parameters. We apply the proposed fast-search method to the G.723.1 coder with the predictive split VQ structure. Simulation results indicate that using this fast-search method, the average searching range of the codebook can be reduced by 20.1% without degradation of the spectral distortion (SD) and additional increases of memories. The reduction of 20.1% in the average searching range results in the decrease of 19.1%, 20.1%, 19.4%, and 12.2% in the number of additions, subtractions, multiplies, and comparisons, respectively  相似文献   

12.
This paper describes the design of a speech coder called pitch synchronous innovation CELP (PSI-CELP) for low hit-rate mobile communications. PSI-CELP is based on CELP, but has more adaptive excitation structures. In voiced frames, instead of conventional random excitation vectors, PSI-CELP converts even the random excitation vectors to have pitch periodicity by repeating stored random vectors as well as by using an adaptive codebook, in silent, unvoiced, and transient frames, the coder stops using the adaptive codebook and switches to fixed random codebooks. The PSI-CELP coder also implements novel structures and techniques: an FIR-type perceptual weighting filter using unquantized LPC parameters, a random codebook with a conjugate structure trained to be robust against channel errors, codebook search with delayed decision, a gain quantization with sloped amplitude, and a moving average prediction coding of LSP parameters, Our speech coder is implemented by DSP chips. Its coded speech quality at 3.6 kb/s with 2.0 kb/s redundancy is comparable to that of the Japanese full-rate VSELP coder at 6.7 kb/s with 4.5 kb/s redundancy. The basic structure of this PSI-CELP coder has been chosen as the Japanese half-rate speech codec for digital cellular telecommunications  相似文献   

13.
Low-rate vector quantizers are designed and simulated for highly correlated Gauss-Markov sources and the resulting performance is compared with Arnstein's optimized predictive quantizer and with Huang and Schultheiss' optimized transform coder. Two implementations of vector quantizers are considered: full search vector quantizers-which are optimal but require large codebook searches-and tree searched vector quantizers-which are suboptimal but require far less searching. The various systems are compared on the basis of performance, complexity, and generality of design techniques.  相似文献   

14.
艾红梅  杨行峻 《电子学报》1997,25(4):120-124
在低速语音编译码系统中,常采用码本激励线性预测编码CELP,其中随机码本的码本结构及应的索算法直接影响着语音编译码系统的语音质量和实时实现中的运算量。  相似文献   

15.
文中将频率敏感算法引入到基本的蚁群算法中,提出了一种改进的蚁群聚类码书设计算法。在提出的码书设计算法中采用LBG码书优化准则,引入了频率敏感算法。仿真实验表明,提出的算法避免了停滞现象发生,有效地提高了其全局搜索能力。  相似文献   

16.
1Introduction,TheCode--ExcitedLinearPredictive(CELP)[13coderprovidedgoodqualityspeechatmediumandlowbitrates,butthisqualityspeechwasatthecostofverycomputationalcomplexity.Recently,therealtimeimplementationoftheCELPcodersonalowpricedigitalsignalprocessorchi…  相似文献   

17.
高效的模糊聚类初始码书生成算法   总被引:2,自引:0,他引:2  
码书设计在矢量量化中至关重要,而多数码书设计算法都是基于初始码书的.从经典的LBG算法的缺陷出发,提出一种基于模糊聚类的高效初始码书生成算法,通过将初始码书的码矢在输入矢量空间中很好地散开,并尽可能占据输入概率密度较大的区域,从而使之后的LBG算法避免陷入局部最优,设计出的码书性能更好,更加接近全局最优,同时加快了收敛速度,减少了迭代次数.将该算法应用于图像编码的实验中,结果表明:该算法能够从效率和质量两方面有效地提高矢量量化的性能.  相似文献   

18.
A New Method of Designing Waveform Codebook   总被引:2,自引:1,他引:1  
ANewMethodofDesigningWaveformCodebookZhangXueyingZhangGang(TaiYuanUniversityofTechnology,TaiYuan030024)AbstractThecodebooksea...  相似文献   

19.
In low rate code-excited linear predictive (CELP) coders, the LPC spectral information is usually quantized and transmitted on a frame-by-frame basis about every 20 to 30 msec. The quality of speech reproduced by a CELP coder can be improved by making spectral transitions as smooth and continuous as possible. One way in which this can be accomplished without increasing the transmission bit rate is to interpolate the LPC spectral parameters between adjacent extraction frames. This, however, usually leads to a dramatic increase in the computations required for the codebook search. The paper presents a new LPC interpolation technique, based on interpolating the impulse response of the LPC synthesis filter. It demonstrates that this method offers a significant complexity reduction for the codebook search over other typical interpolation schemes. Furthermore, the experiments show that the coder using the impulse response for interpolation produces the same speech quality as the coder using the LSP parameters for interpolation, and both these parameter sets are superior to other LPC representations for interpolation  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号