首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
ACELP中的码本搜索由于其巨大的运算量,难以在实时系统中实现。为降低计算复杂度,提出了一种通过对初始码本进行预选、对同轨道内脉冲进行组合替换、同时设置合适的初始脉冲对数阀值N的快速码本搜索方法。实验表明,在保证语音品质基本不变的前提下,该方法可使得算法的复杂度降低至传统搜索法的9.7%。  相似文献   

2.
基于码本的说话人自适应方法   总被引:1,自引:0,他引:1  
吕津  赵明生  王作英 《电子学报》2001,29(4):456-460
本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途.  相似文献   

3.
在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低.为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究.提出了一种改进的基于码本映射的语音带宽扩展算法:在码本映射的过程中,使用加权系数来得到映射码本.客观测试结果表明,用此算法得到的宽带语音的谱失真度比用一般的码本映射降低至少2%.主观测试结果表明,用此算法得到的宽带语音具有更好的可懂度和自然度.  相似文献   

4.
AMR-WB是一个可以在低速时取得很高语音质量的宽带语音编码器,但是当AMR-WB编码算法应用于一些对硬件要求比较苛刻的领域时,其编码的复杂度偏高。固定码本搜索方法在语音编码中占有很大的比例,论文提出了用于AMR-WB语音编码标准的一个新的快速固定码本搜索方法,使其计算量下降了44.3%。  相似文献   

5.
《现代电子技术》2019,(12):165-167
基于预测编码、SOM自主神经网络矢量编码和Huffman编码的联合编码算法(PV算法)压缩效果虽然较好,但它在对每段语音编码时,都需要利用该段语音信号,通过SOM自主神经网络训练得到码本,算法复杂、耗时。为此文中提出从具有一般特征的多段语音信号中通过SOM自主神经网络训练提取码本,所有的语音信号段PV编码都统一用该码本,不需要对每一段语音信号编码都做一次提取码本的运算,这样不仅节省了每段语音PV编码时用于训练码本的时间,也节省了需要编码的专用码本的信息,减小了码率。实验结果显示,通用码本的PV编码算法在保证一定语音质量的条件下,是可行的。文中提出的编码算法在语言压缩编码方面具有较高的研究价值和很好的应用前景。  相似文献   

6.
俞捷  诸庆麟 《通信学报》1990,11(6):34-37
码激励线性预测(CELP)编码在中低速率上与传统的LPC声码器相比可以提供更加自然的语音质量。本文介绍了CELP的基本原理及激励码本的构成。然后提出了在4.8 kbit/s速率上改进话音质量的两种方法:①计算长时预测参数的半闭环搜索法;②激励码本的时变修正法。计算机模拟结果表明,采用这两种方法可使语音质量得到改善。  相似文献   

7.
在G.729的基本框架下,码本搜索采用次最优部分码本快速搜索法,知觉加权滤波器使用基于声学心理模型的知觉加权滤波器,使得8Kb/s共扼结构代数码激励线性预测语音编码在不降低语音质量的情况下降低计算复杂度。次最优部分码本快速搜索方法虽然降低搜索准确度,但是大大减小了搜索时的数据处理量;声学心理滤波器考虑人耳对不同频率信号的不同敏感度,因而能获得更好的主观音质效果。仿真结果表明,该算法复杂度降低,并取得满意的合成语音质量。  相似文献   

8.
为了将源说话人的语音特征进行转换,使得听起来像是目标说话人的语音,本文提出了一种同语种的说话人转换算法。算法分为两个部分,一是利用高斯混合模型进行谱包络的转换,采用改进的方法对模型进行训练,去除语音数据时间对齐不准确的影响;二是基于高斯混合模型分类器和残差码本对残差信号预测。算法还对转换语音进行了后续处理,增强了语音的自然度。非正式的听觉测试表明,在利用时间不长的语音数据训练后,此算法可以进行说话人的转换,转换语音明显带有目标说话人的特征,且具有较高的可懂度。  相似文献   

9.
本文提出了波形矢量量化器码本的特征变量,对码本的分布特性进行了研究,提出了合理构造初始码本、快速训练码本和快速量化矢量的设计波形矢量量化器新算法。计算机模拟结果表明,新算法明显缩减了码本训练时间、提高了矢量量化的速度。  相似文献   

10.
矢量量化(VQ)是一种极其重要的信号压缩方法,广泛地应用于图像信号压缩、语音信号压缩领域。它I的主要问题是码本设计,在码本设计过程中,有许多算法被提出。本文提出了PSO和LBG算法相结合的1PSO—LBG算法采设计码本,改善了码本质量,提高了收敛速度。  相似文献   

11.
A fast-search method is introduced to reduce the searching range of a codebook using the ordering property of LSF parameters. We apply the proposed fast-search method to the G.723.1 coder with the predictive split VQ structure. Simulation results indicate that using this fast-search method, the average searching range of the codebook can be reduced by 20.1% without degradation of the spectral distortion (SD) and additional increases of memories. The reduction of 20.1% in the average searching range results in the decrease of 19.1%, 20.1%, 19.4%, and 12.2% in the number of additions, subtractions, multiplies, and comparisons, respectively  相似文献   

12.
该文基于代数码激励线性预测(ACELP)语音编码算法提出了非均匀和部分搜索域代数码书。非均匀代数码书由代数码书的脉冲非均匀统计特性确定,部分搜索域代数码书则由代数码书矢量的周期性确定,该方法有效地弥补了低比特率情况下代数码书中脉冲数不足的缺点。在使用上述两项技术时,为保持基音的连续性,该编码器对语音段和非语音段采用了不同的基音估计方法。主观和客观的听力测试表明,当该技术应用于4kb/s 散布脉冲码激励线性预测(DP-CELP)语音编码器时,重建语音的质量得到明显改善,尤其是对女性讲话者。  相似文献   

13.
1Introduction,TheCode--ExcitedLinearPredictive(CELP)[13coderprovidedgoodqualityspeechatmediumandlowbitrates,butthisqualityspeechwasatthecostofverycomputationalcomplexity.Recently,therealtimeimplementationoftheCELPcodersonalowpricedigitalsignalprocessorchi…  相似文献   

14.
1IntroductionThecurrentachvityinspeeChcodinginEuropeisfocusedonselectinganewpan-Europestalldardforadigitalmobilesystemknownasthehalf-ratecodingsystem.TheCELP-basedconfigurationhasbecomeoneofthecandidatesforit.TheshortcomingofthefundamentalCELPisitSgreatstorageandcomputation,andthefixedcodebooksearchcoststhemost.Inthispaper,wepresentanoverlappingcenterclippingcodebookandintroducefastsearchalgoritlllnsofconvoluhon,auto-correlationandcross-correlationonthebasisofthenewcodebook.Byuseofthisim…  相似文献   

15.
Trellis source codes consist of a finite-state machine decoder and a trellis search algorithm, such as the Viterbi algorithm, as the encoder. The encoder experiments with a local copy of the decoder and determines the best channel path map in the sense that it will yield the smallest average distortion between the source sequence and the reproduction sequence given the codebook. In this paper we present a coding system and a design algorithm for predictive trellis coding. Results obtained via simulation are compared for trellis and predictive trellis codes designed for first-order autoregressive sources with Gaussian and Laplacian innovations and for sampled speech. On a random source which models speech, simulation results of the predictive and nonpredictive trellis codes designed by the generalized Lloyd algorithm and those obtained by other researchers are compared. Issues related to computational complexity, the effects of initial codebook selection, training sequence segmentation, search length, channel errors, and algorithm convergence are addressed.  相似文献   

16.
陈楠  鲍长春 《电子学报》2019,47(1):227-233
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法.  相似文献   

17.
Task-dependent visual-codebook compression   总被引:1,自引:0,他引:1  
  相似文献   

18.
A fast vector-sum codebook search method for low bit rate speech coding is presented. In this method, the codebook search is simplified by designing a vector-sum codebook that consists of orthonormal regular pulse basis vectors. A further simplification is achieved by adopting backward filtering. The method proposed has significantly reduced computational complexity, compared with the conventional VSELP, without producing any additional degradation in the quality of the synthesised speech  相似文献   

19.
This paper describes the design of a speech coder called pitch synchronous innovation CELP (PSI-CELP) for low hit-rate mobile communications. PSI-CELP is based on CELP, but has more adaptive excitation structures. In voiced frames, instead of conventional random excitation vectors, PSI-CELP converts even the random excitation vectors to have pitch periodicity by repeating stored random vectors as well as by using an adaptive codebook, in silent, unvoiced, and transient frames, the coder stops using the adaptive codebook and switches to fixed random codebooks. The PSI-CELP coder also implements novel structures and techniques: an FIR-type perceptual weighting filter using unquantized LPC parameters, a random codebook with a conjugate structure trained to be robust against channel errors, codebook search with delayed decision, a gain quantization with sloped amplitude, and a moving average prediction coding of LSP parameters, Our speech coder is implemented by DSP chips. Its coded speech quality at 3.6 kb/s with 2.0 kb/s redundancy is comparable to that of the Japanese full-rate VSELP coder at 6.7 kb/s with 4.5 kb/s redundancy. The basic structure of this PSI-CELP coder has been chosen as the Japanese half-rate speech codec for digital cellular telecommunications  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号