首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统中的特征向量矢量量化的码书构造过程。以往的矢量量化通常采用基本算法LBG,在此基础上,引入了一种时间复杂性和空间复杂性有所降低的改进算法。该算法的核心是自适应地生成初始码书以及对初始码书的二次构造过程。从降低时间复杂度和节省存储空间,提高识别率的角度,对该算法进行了讨论。  相似文献   

2.
语音识别技术已在通信及控制等领域得到广泛应用,针对孤立词语音识别矢量量化中LBG算法对初始码书选择敏感,容易陷入局部最优、泛化能力不强的缺点,将免疫粒子群优化算法(IPSO)和LBG算法结合进行聚类分析,从而得到基于IPSO-LBG的码书设计方法,并将其用于基于离散隐马尔可夫模型(DHMM)的孤立词语音识别系统中。通过实验,与传统LBG算法的DHMM孤立词语音识别系统的识别结果相比,证明了改进的系统有较好的识别率和适应性。  相似文献   

3.
李德鹏  高永安 《电子器件》2011,34(6):731-734
G.729语音编码算法复杂,很大程度上要归因于码书搜索算法。为了降低码书搜索复杂度,G.729的简化版G.729A采用了自适应码书的偶样点开环基音搜索,使得编码复杂度大为降低,不过编码仍要花费很多的时间。通过对G.729码书搜索算法的研究,提出了对自适应码书的改进。改进了自适应码书搜索的G.729编码语音质量不低于G.729A的语音质量,但自适应搜索复杂度大大降低。  相似文献   

4.
代数码书作为一种流行的固定码书结构,其搜索方法直接影响解码语音质量及计算复杂度.本文提出了一种代数码书分级分段优化搜索GSOS(Graded and Subsection Optimization Search)方法.GSOS方法融合了脉冲替代法、分段搜索及分级优化方法的优点,通过创建优质的初始码书,达到提高初始码书质量的目的,并将码书矢量的乘法运算用分段子码书的加法运算替代,同时将脉冲按贡献不同进行分级,由此提高脉冲替代优化的搜索效率;将该方法用于自适应多速率宽带语音编码器AMR-WB固定码书搜索阶段,实验结果表明,所提出的搜索方法可使固定码书搜索计算量降为深度优先树搜索方法的13.75%,但解码语音质量只降低了4.01%,主观听觉感受基本感觉不出差异.  相似文献   

5.
0102831基于进化编程的改进 GLA 算法[刊]/王进//红外与激光工程.—2000,29(5).—37~41(E)文中提出的矢量量化算法以种群为基础,通过变异算子提高种群的平均适应值,使其逃离局部最小点,降低了该算法对初始码书的敏感程度,然后使用选择算子对种群进行有针对性地操作。高斯-马尔可夫序列实验表明,该算法较好地实现了全局最优.并有助于克服对初始码本较为敏感的缺点。参6Y2000-62049-401 02832网络拒绝服务的形式框架与评价方法=A formalframework and evaluation method for network denial ofservice[会,英]/Meadows,O.//Proceedings of IEEE  相似文献   

6.
基于Hadamard变换和K-means理论,针对Chen的初始码书设计算法的随机性较强和峰值信噪比(PSNR)不高这两个缺点,提出了一种改进的码书设计算法。本算法利用统计特征量的分类平均法生成初始码书,然后提高求质心的频率,每当一个训练矢量被分类到胞腔时,就求出相应胞腔的质心来代替原有的码字。该算法结合LBG算法的优点,调整后的码字代表了整个胞腔的特性,加速了码书的收敛速度,提升了码书的性能。仿真实验结果表明,较Chen的算法图像效果,即峰值信噪比(PSNR),平均提高了0.5 dB,在迭代次数较小时甚至达0.9 dB。  相似文献   

7.
由于应用基本粒子群进行码书设计时容易出现陷入局部最优解的问题,故引进模拟退火算法对全局极值的更新条件做了改进,提出了一种新的码书设计方法.改进算法的全局极值更新条件采用了随机概率扰动接受的方式,既接收优化解,也可以接受恶化解,从而增加全局最优区域的搜索能力,避免了粒子过早的"趋同性".采用提出的码书设计方法进行于语音矢量量化表明新提出的算法所重构的语音无论是从清晰度、自然度还是理解性上都要好于基本粒子群算法所重构的语音.增大全局搜索范围.  相似文献   

8.
基于局部余弦变换的低比特变速率语音编码算法研究   总被引:1,自引:0,他引:1  
提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。  相似文献   

9.
蒋刚毅  郑义 《电子学报》1995,23(11):55-59
本文针对语音信号的矢量量化码书进行了研究,利用矢量量化码书的码字和值及码字差值作为码书的特征变量,对不同语言信号的矢量量化码书分布情况做了分析,并给出了基本结果。  相似文献   

10.
针对在LBG算法中存在初始码书的选择极易影响码书训练的收敛速度和最终码书性能的缺陷,提出了一种基于微粒群的矢量量化码书设计算法.首先产生具有一定全局性特点的初始码书,然后再应用LBG算法进行优化得到同时具有局部特性的码书.实验结果验证了该算法的合理性.  相似文献   

11.
矢量量化(VQ)是语音识别中广泛应用的一种数据压缩和编码方法。在矢量量化的码本设计过程中,经典的LBG算法收敛速度快,但极易陷入局部最优,且初始码本的生成对最佳码本的设计影响很大。考虑到遗传算法(GA)是一种具有全局优化搜索能力的算法,提出了GA和LBG算法相结合的GA L算法来优化码本,改善了码本质量,并将其应用于非特定人汉语连续数字语音识别中。实验结果表明,GA L算法优于传统的LBG算法。  相似文献   

12.
陈楠  鲍长春 《电子学报》2019,47(1):227-233
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法.  相似文献   

13.
本文提出了波形矢量量化器码本的特征变量,对码本的分布特性进行了研究,提出了合理构造初始码本、快速训练码本和快速量化矢量的设计波形矢量量化器新算法。计算机模拟结果表明,新算法明显缩减了码本训练时间、提高了矢量量化的速度。  相似文献   

14.
在对语音实验分析的基础上。提出一种语音波形编码的新方法——半波编码。文中详细阐述了浊音初始码本和码本的制作方法,并类推出清音和无声码本的制作。  相似文献   

15.
本文讨论了自组织特征映射人工神经网络在语音矢量量化中应用时所涉及的两个重要问题,即码本训练和码本搜索的问题。根据语音反射系数的特点,提出了训练中初始码本的选择原则和实用训练算法。利用特征映射网络的聚类特性和语音相邻帧间的相关性,提出了码本搜索的两种快速算法——子域搜索法和邻域搜索法。大量实验结果表明,这两种快速搜索方法相结合,搜索时间减少为常用的LBG全搜索算法的1/4或1/10,同时保持精度不下降。本文提出的方法已在一种极低数据率的声码器中得到成功应用。  相似文献   

16.
矢量量化(VQ)是一种极其重要的信号压缩方法,广泛地应用于图像信号压缩、语音信号压缩领域。它I的主要问题是码本设计,在码本设计过程中,有许多算法被提出。本文提出了PSO和LBG算法相结合的1PSO—LBG算法采设计码本,改善了码本质量,提高了收敛速度。  相似文献   

17.
高质量4~8kb/s变速率有限状态ACELP语音编码算法研究   总被引:3,自引:0,他引:3  
4~8kb/s变速率有限状态代数码激励线性预测语音编码(VR-FS-ACEL)是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,其中4kb/s的合成语音质量超过了北美8kb/s VSELP,接近长途质量,而6kb/s和8kb/s合成语音质量达到了长途质量,与G.7298kb/s CS-ACELP相当.  相似文献   

18.
该文基于代数码激励线性预测(ACELP)语音编码算法提出了非均匀和部分搜索域代数码书。非均匀代数码书由代数码书的脉冲非均匀统计特性确定,部分搜索域代数码书则由代数码书矢量的周期性确定,该方法有效地弥补了低比特率情况下代数码书中脉冲数不足的缺点。在使用上述两项技术时,为保持基音的连续性,该编码器对语音段和非语音段采用了不同的基音估计方法。主观和客观的听力测试表明,当该技术应用于4kb/s 散布脉冲码激励线性预测(DP-CELP)语音编码器时,重建语音的质量得到明显改善,尤其是对女性讲话者。  相似文献   

19.
Trellis source codes consist of a finite-state machine decoder and a trellis search algorithm, such as the Viterbi algorithm, as the encoder. The encoder experiments with a local copy of the decoder and determines the best channel path map in the sense that it will yield the smallest average distortion between the source sequence and the reproduction sequence given the codebook. In this paper we present a coding system and a design algorithm for predictive trellis coding. Results obtained via simulation are compared for trellis and predictive trellis codes designed for first-order autoregressive sources with Gaussian and Laplacian innovations and for sampled speech. On a random source which models speech, simulation results of the predictive and nonpredictive trellis codes designed by the generalized Lloyd algorithm and those obtained by other researchers are compared. Issues related to computational complexity, the effects of initial codebook selection, training sequence segmentation, search length, channel errors, and algorithm convergence are addressed.  相似文献   

20.
基于ACELP的嵌入式语音编码算法   总被引:1,自引:0,他引:1  
范睿  鲍长春  李锐 《通信学报》2007,28(10):48-54
为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相比,实现的编码器能够获得具有嵌入结构的码流,不仅能够保证核心层的合成语音质量,而且在增强层也取得了与对应速率的现有标准编码器相当的合成语音质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号