期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种2.4kbps波形插值声码器 总被引：2，自引：0，他引：2

杨慧敏陈弘毅孙义和吴历曦《电子学报》1998,26(11):110-113,106

本文描述了波形插值语音分析与合成方法的基本原理和编码技术，并给出一种２．４ｋｂｐｓ波形插值声码器的实际结构，该声码器利用提取特征波形及浊／清音成分分离的方法，有效地去除了残差信号中基音波形的冗余度，能在２．４ｋｂｐｓ数据率下获得高质量的合成语音。相似文献

2.

一种采用定点DSP实现的1.8kbps MBE-LPC声码器

李永明陈弘毅朱益厅《半导体学报》2000,21(8)

提出了一种结合MBE(多带激励)模型和LPC(线性预测编码)模型的1.8kbps声码器.在这种声码器中,采用LPC特征参数来代表语音帧的频谱,利用LPC残差进行基音提取和多带清浊音判决,采用MBE模型合成语音,并在高频浊音带的语音合成中混以清音.在定点Mo-torola DSP56002 EVM上,可以在1.8kbps的码率下对语音进行实时的编解码处理,具有存储量和计算量较小的特点.其合成语音质量超过了LPC-10e. 相似文献

3.

一种采用定点DSP实现的1.8kbps MBE-LPC声码器

李永明陈弘毅朱益厅《半导体学报》2000,21(8):803-809

提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e. 相似文献

4.

语音信号MELP编码的研究与实现 总被引：1，自引：1，他引：0

张毓忠梅武钢《电声技术》2000,(11):6-9

对该编码技术进行了深入的研究,并在此基础上实现了２．４ｋｂｐｓＭＥＬＰ声码器的计算机模拟,提出了对ＭＥＬＰ多级矢量量化搜索方法的改进,以及用两片ＴＭＳ３２０Ｃ３１并行处理实现ＭＥＬＰ算法的硬件电路设计。相似文献

5.

多带激励低速率语音压缩编码算法研究及实时实现 总被引：3，自引：0，他引：3

崔慧娟唐昆郑海生江灏《电子学报》1998,26(10):129-132

本文以多带激励声码器为模型，采用了多种技术去降低编码速率和改善音质，我们利用动态规划算法对基音周期进行了平滑，去除了声码器中常用的音调噪声，ＭＢＥ算法对谱包络的量化要花费大量的比特，这里利用ＬＰＣ全极点模型谱逼近ＭＢＥ谱包络，并采用共振峰增强技术来补偿模型误差，对谱幅度参数的量化，采用了分裂矢量量化（ＳＰＶＱ）和多级矢量量化（ＭＳＶＱ）的方法，使之在２．４ｋｂｐｓ，１．２ｋｂｐｓ及８００ｂｐｓ等速相似文献

6.

基于相空间重构和基频分析的单信道混合语音清浊音分类方法

郭海燕杨震《信号处理》2009,25(8)

本文提出了一种基于相空间重构(phase-space reconstruction)和基频分析的单信道混合语音清浊音分类新方法,引入基频分析对采用基于相空间重构的单信道混合语音清浊音分类算法的判定结果进行检验修正,有效的降低了将浊音/清音误判为浊音/浊音和将浊音/浊音误判为浊音/清音的比率.首先,采用基于相空间重构的清浊音分类算法将单信道混合语音初步分为清/清音,浊/清音,浊/浊音三类.其次,采用基于增强型综合自相关函数ESACF(enhanced summary autocorrelation function)的多基频分析和基于自相关法的单基频分析分别对浊/浊音帧和浊/清音帧进行修正.实验结果证明,基于相空间重构和基频分析的单信道混合语音清浊音分类方法性能优于基于相空间重构的单信道混合语音清浊音分类方法. 相似文献

7.

基于MBE算法的一种新的语音合成方法 总被引：1，自引：0，他引：1

潘胜昔王作英《电子学报》1997,25(10):1-4

ＭＢＥ音编译码算法的关键是合成语音的连续性，本文在研究ＭＢＥ语音编译码模型、方法的基础上，提出用一个慢变频正弦信号产生窄带等功率谱信号作激励产生清音，同时采用增衰因子，把清音、浊音的合成统一到时域方法下的新算法，进一步保证了合成语音的度及其音边续性，对在４．８ｋｂｐｓ计算机模拟结果的非正式听音表明，新的算法较传统ＭＢＥ在音质上自然度更好。相似文献

8.

一种2.4kbps改进型MBELP编码 总被引：1，自引：0，他引：1

钟明江太辉《电子科学学刊》2000,22(5):836-841

该文给出了一种改进的２．４ｋｂ／ｓ多带激励线性预测（ＩＭＢＥＬＰ）语音编码算法,与传统的ＭＢＥＬＰ算法相比,本算法在音质提取和清／浊音判决上采取了一些改进措施,使得合成语音质量有一定的提高。本文详细介绍了改进后的ＭＢＥＬＰ算法,并将其在基音提取和清／浊音判决的结果与传统的ＭＢＥＬＰ进行比较。相似文献

9.

语音清浊音差分LSF参数矢量量化方法

方腾龙赵晓群韩笑蕾顾杰《电声技术》2010,34(11):61-64,71

差分LSF参数的动态范围小于LSF参数,可作为一种新的模型参数应用于语音编码中。分析了2种新的差分LSF参数矢量量化方法：增强差分分裂参数矢量量化（EnhancedDifferentialSplitVectorQuantization,EDSVQ）和增强EDSVQ（EnhancedEDSVQ,EEDSVQ）,并采用英语清、浊音的差分LSF参数进行分裂矢量量化实验。结果表明,EEDSVQ能有效抑制直接对差分LSF参数进行矢量量化引起的量化误差传递和叠加;在分配相同量化比特数的情况下．清音的量化效果优于浊音．为获得相同量化效果可减少对清音的量化比特数。相似文献

10.

基于MELP的变速率分类型语音编码算法 总被引：1，自引：0，他引：1

肖玉娟赵利《电声技术》2013,37(2):54-57

提出了一种基于混合激励线性预测的变速率分类型语音编解码算法。该算法在MELP编码前用语音活动检测法判决有声无声,并且将过渡帧划分为2个子帧,根据语音的特征把语音帧分为静音帧、浊音帧、清音帧和过渡帧4类,分别进行分析和合成,做到在降低语音编码率的同时得到较好的语音质量。相似文献

11.

Hardware Realization of Waveform Vector Quantizers

Tao B. Abut H. Gray R. 《Selected Areas in Communications, IEEE Journal on》1984,2(2):343-352

A real-time full search vector quantization system for speech waveform coding is implemented using LSTTL and CMOS devices. The system consists of low-pass filters, A/D and D/A converters, an algorithm for discriminating voiced and unvoiced speed, a full search vector quantizer encoder and decoder, and a microprocessor-based controller. The system is designed to operate at two possible rates: one bit/sample using a dimension 8 vector quantizer (6500 bits/s) or 2 bits/sample using a dimension 4 vector quantizer (13 000 bits/s). In both cases the codebooks have rate 8 bits/vector. Separate codebooks were designed for voiced and unvoiced speech based on a training sequence of 640 000 samples containing five different speakers. The subjective and quantitative results are compared to both simulations and with a real-time array processor based implementation. 相似文献

12.

基于离散余弦变换的波形内插语音编码算法 总被引：2，自引：0，他引：2

下载免费PDF全文

刘靖宇鲍长春李如玮《电子学报》2009,37(7):1599-1605

针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果. 相似文献

13.

A Low-Rate Digital Formant Vocoder

Chong Un 《Communications, IEEE Transactions on》1978,26(3):344-355

A complete algorithm of a 1200-bits/s digital formant vocoder system is described. This vocoder algorithm draws heavily on the results of recent research in linear predictive coding. The transmitting parameters are frequencies and amplitudes of the first three formants, the pitch period, voiced/unvoiced decision, and the gain. Formant bandwidths are estimated at the synthesizer by using the amplitude information. The synthesizer structure is in the parallel form. The synthetic speech quality at 1200 bits/s is reasonably good; most of the speech is intelligible and speaker-recognizable. 相似文献

14.

Real-time implementation and performance evaluation of speech classifiers in speech analysis-synthesis

Sandeep Kumar 《ETRI Journal》2021,43(1):82-94

In this work, six voiced/unvoiced speech classifiers based on the autocorrelation function (ACF), average magnitude difference function (AMDF), cepstrum, weighted ACF (WACF), zero crossing rate and energy of the signal (ZCR-E), and neural networks (NNs) have been simulated and implemented in real time using the TMS320C6713 DSP starter kit. These speech classifiers have been integrated into a linear-predictive-coding-based speech analysis-synthesis system and their performance has been compared in terms of the percentage of the voiced/unvoiced classification accuracy, speech quality, and computation time. The results of the percentage of the voiced/unvoiced classification accuracy and speech quality show that the NN-based speech classifier performs better than the ACF-, AMDF-, cepstrum-, WACF- and ZCR-E-based speech classifiers for both clean and noisy environments. The computation time results show that the AMDF-based speech classifier is computationally simple, and thus its computation time is less than that of other speech classifiers, while that of the NN-based speech classifier is greater compared with other classifiers. 相似文献

15.

基于幅度压缩滤波的清浊音分类及基音估计

徐静云赵晓群王峤王缔罡《电子与信息学报》2016,38(3):586-593

该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称平均幅度和函数的脉冲序列加权算法(SIM)确定谐波数目;最后,利用动态规划估计出基音,用基于3元素特征矢量的高斯混合模型对清浊音进行分类。仿真结果表明,在实环境下,所提方法能有效抑制清浊误判及基音估计错误现象的发生,性能优于传统方法。相似文献

16.

高质量300bit/s声码器算法

李晔樊燕红郝秋赟郭强《电声技术》2010,34(12):51-53

基于增强型混合激励线性预测模型,提出一种高质量的300 bit/s声码器算法。每个语音帧仅提取少量参数,为提高量化效率,每8个语音帧组成一个超级帧,对超级帧参数进行矢量量化。算法采用基于模式转移的码本映射估计带通浊音度参数,改善其量化精度。对不同带通浊音度模式下的基音参数量化码本尺寸进行联合优化,提高量化效率。同时,对线谱频率参数采用带有级间预测的多级矢量量化以降低谱失真。主观听觉测试表明,此声码器具有较高的可懂度并具有一定的自然度,诊断押韵测试（DRT）的分数为84.2%。相似文献

17.

基于局部余弦变换的低比特变速率语音编码算法研究 总被引：1，自引：0，他引：1

董恩清蔡光跃李永利《通信学报》2005,26(5):122-127

提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。相似文献