首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 281 毫秒
1.
一种2.4kbps波形插值声码器   总被引:2,自引:0,他引:2  
杨慧敏  陈弘毅  孙义和  吴历曦 《电子学报》1998,26(11):110-113,106
本文描述了波形插值语音分析与合成方法的基本原理和编码技术,并给出一种2.4kbps波形插值声码器的实际结构,该声码器利用提取特征波形及浊/清音成分分离的方法,有效地去除了残差信号中基音波形的冗余度,能在2.4kbps数据率下获得高质量的合成语音。  相似文献   

2.
提出了一种结合MBE(多带激励)模型和LPC(线性预测编码)模型的1.8kbps声码器.在这种声码器中,采用LPC特征参数来代表语音帧的频谱,利用LPC残差进行基音提取和多带清浊音判决,采用MBE模型合成语音,并在高频浊音带的语音合成中混以清音.在定点Mo-torola DSP56002 EVM上,可以在1.8kbps的码率下对语音进行实时的编解码处理,具有存储量和计算量较小的特点.其合成语音质量超过了LPC-10e.  相似文献   

3.
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e.  相似文献   

4.
语音信号MELP编码的研究与实现   总被引:1,自引:1,他引:0  
对该编码技术进行了深入的研究,并在此基础上实现了2.4 kbps MELP声码器的计算机模拟,提出了对MELP多级矢量量化搜索方法的改进,以及用两片TMS320C31并行处理实现MELP算法的硬件电路设计。  相似文献   

5.
多带激励低速率语音压缩编码算法研究及实时实现   总被引:3,自引:0,他引:3  
崔慧娟  唐昆  郑海生  江灏 《电子学报》1998,26(10):129-132
本文以多带激励声码器为模型,采用了多种技术去降低编码速率和改善音质,我们利用动态规划算法对基音周期进行了平滑,去除了声码器中常用的音调噪声,MBE算法对谱包络的量化要花费大量的比特,这里利用LPC全极点模型谱逼近MBE谱包络,并采用共振峰增强技术来补偿模型误差,对谱幅度参数的量化,采用了分裂矢量量化(SPVQ)和多级矢量量化(MSVQ)的方法,使之在2.4kbps,1.2kbps及800bps等速  相似文献   

6.
本文提出了一种基于相空间重构(phase-space reconstruction)和基频分析的单信道混合语音清浊音分类新方法,引入基频分析对采用基于相空间重构的单信道混合语音清浊音分类算法的判定结果进行检验修正,有效的降低了将浊音/清音误判为浊音/浊音和将浊音/浊音误判为浊音/清音的比率.首先,采用基于相空间重构的清浊音分类算法将单信道混合语音初步分为清/清音,浊/清音,浊/浊音三类.其次,采用基于增强型综合自相关函数ESACF(enhanced summary autocorrelation function)的多基频分析和基于自相关法的单基频分析分别对浊/浊音帧和浊/清音帧进行修正.实验结果证明,基于相空间重构和基频分析的单信道混合语音清浊音分类方法性能优于基于相空间重构的单信道混合语音清浊音分类方法.  相似文献   

7.
基于MBE算法的一种新的语音合成方法   总被引:1,自引:0,他引:1  
MBE音编译码算法的关键是合成语音的连续性,本文在研究MBE语音编译码模型、方法的基础上,提出用一个慢变频正弦信号产生窄带等功率谱信号作激励产生清音,同时采用增衰因子,把清音、浊音的合成统一到时域方法下的新算法,进一步保证了合成语音的度及其音边续性,对在4.8kbps计算机模拟结果的非正式听音表明,新的算法较传统MBE在音质上自然度更好。  相似文献   

8.
一种2.4kbps改进型MBELP编码   总被引:1,自引:0,他引:1  
该文给出了一种改进的2.4kb/s多带激励线性预测(IMBELP)语音编码算法,与传统的MBELP算法相比,本算法在音质提取和清/浊音判决上采取了一些改进措施,使得合成语音质量有一定的提高。本文详细介绍了改进后的MBELP算法,并将其在基音提取和清/浊音判决的结果与传统的MBELP进行比较。  相似文献   

9.
方腾龙  赵晓群  韩笑蕾  顾杰 《电声技术》2010,34(11):61-64,71
差分LSF参数的动态范围小于LSF参数,可作为一种新的模型参数应用于语音编码中。分析了2种新的差分LSF参数矢量量化方法:增强差分分裂参数矢量量化(EnhancedDifferentialSplitVectorQuantization,EDSVQ)和增强EDSVQ(EnhancedEDSVQ,EEDSVQ),并采用英语清、浊音的差分LSF参数进行分裂矢量量化实验。结果表明,EEDSVQ能有效抑制直接对差分LSF参数进行矢量量化引起的量化误差传递和叠加;在分配相同量化比特数的情况下.清音的量化效果优于浊音.为获得相同量化效果可减少对清音的量化比特数。  相似文献   

10.
基于MELP的变速率分类型语音编码算法   总被引:1,自引:0,他引:1  
肖玉娟  赵利 《电声技术》2013,37(2):54-57
提出了一种基于混合激励线性预测的变速率分类型语音编解码算法。该算法在MELP编码前用语音活动检测法判决有声无声,并且将过渡帧划分为2个子帧,根据语音的特征把语音帧分为静音帧、浊音帧、清音帧和过渡帧4类,分别进行分析和合成,做到在降低语音编码率的同时得到较好的语音质量。  相似文献   

11.
A real-time full search vector quantization system for speech waveform coding is implemented using LSTTL and CMOS devices. The system consists of low-pass filters, A/D and D/A converters, an algorithm for discriminating voiced and unvoiced speed, a full search vector quantizer encoder and decoder, and a microprocessor-based controller. The system is designed to operate at two possible rates: one bit/sample using a dimension 8 vector quantizer (6500 bits/s) or 2 bits/sample using a dimension 4 vector quantizer (13 000 bits/s). In both cases the codebooks have rate 8 bits/vector. Separate codebooks were designed for voiced and unvoiced speech based on a training sequence of 640 000 samples containing five different speakers. The subjective and quantitative results are compared to both simulations and with a real-time array processor based implementation.  相似文献   

12.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

13.
A complete algorithm of a 1200-bits/s digital formant vocoder system is described. This vocoder algorithm draws heavily on the results of recent research in linear predictive coding. The transmitting parameters are frequencies and amplitudes of the first three formants, the pitch period, voiced/unvoiced decision, and the gain. Formant bandwidths are estimated at the synthesizer by using the amplitude information. The synthesizer structure is in the parallel form. The synthetic speech quality at 1200 bits/s is reasonably good; most of the speech is intelligible and speaker-recognizable.  相似文献   

14.
In this work, six voiced/unvoiced speech classifiers based on the autocorrelation function (ACF), average magnitude difference function (AMDF), cepstrum, weighted ACF (WACF), zero crossing rate and energy of the signal (ZCR-E), and neural networks (NNs) have been simulated and implemented in real time using the TMS320C6713 DSP starter kit. These speech classifiers have been integrated into a linear-predictive-coding-based speech analysis-synthesis system and their performance has been compared in terms of the percentage of the voiced/unvoiced classification accuracy, speech quality, and computation time. The results of the percentage of the voiced/unvoiced classification accuracy and speech quality show that the NN-based speech classifier performs better than the ACF-, AMDF-, cepstrum-, WACF- and ZCR-E-based speech classifiers for both clean and noisy environments. The computation time results show that the AMDF-based speech classifier is computationally simple, and thus its computation time is less than that of other speech classifiers, while that of the NN-based speech classifier is greater compared with other classifiers.  相似文献   

15.
该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称平均幅度和函数的脉冲序列加权算法(SIM)确定谐波数目;最后,利用动态规划估计出基音,用基于3元素特征矢量的高斯混合模型对清浊音进行分类。仿真结果表明,在实环境下,所提方法能有效抑制清浊误判及基音估计错误现象的发生,性能优于传统方法。  相似文献   

16.
李晔  樊燕红  郝秋赟  郭强 《电声技术》2010,34(12):51-53
基于增强型混合激励线性预测模型,提出一种高质量的300 bit/s声码器算法。每个语音帧仅提取少量参数,为提高量化效率,每8个语音帧组成一个超级帧,对超级帧参数进行矢量量化。算法采用基于模式转移的码本映射估计带通浊音度参数,改善其量化精度。对不同带通浊音度模式下的基音参数量化码本尺寸进行联合优化,提高量化效率。同时,对线谱频率参数采用带有级间预测的多级矢量量化以降低谱失真。主观听觉测试表明,此声码器具有较高的可懂度并具有一定的自然度,诊断押韵测试(DRT)的分数为84.2%。  相似文献   

17.
基于局部余弦变换的低比特变速率语音编码算法研究   总被引:1,自引:0,他引:1  
提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号