共查询到19条相似文献,搜索用时 109 毫秒
1.
2.
3.
语音信号MELP编码的研究与实现 总被引:1,自引:1,他引:0
对该编码技术进行了深入的研究,并在此基础上实现了2.4 kbps MELP声码器的计算机模拟,提出了对MELP多级矢量量化搜索方法的改进,以及用两片TMS320C31并行处理实现MELP算法的硬件电路设计。 相似文献
4.
针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果. 相似文献
5.
论文将改进型预测多脉冲语音编码方法用于低速率语音码器的设计,并进行了计算机仿真。对2.4kg/s声码器各参数的选择、比特分配以及LPC参数地矢量量化作了介绍,最后给出计算机仿真的结果。 相似文献
6.
7.
基于MBE算法的一种新的语音合成方法 总被引:1,自引:0,他引:1
MBE音编译码算法的关键是合成语音的连续性,本文在研究MBE语音编译码模型、方法的基础上,提出用一个慢变频正弦信号产生窄带等功率谱信号作激励产生清音,同时采用增衰因子,把清音、浊音的合成统一到时域方法下的新算法,进一步保证了合成语音的度及其音边续性,对在4.8kbps计算机模拟结果的非正式听音表明,新的算法较传统MBE在音质上自然度更好。 相似文献
8.
本文将基音周期波形(PCW)在时间方向上逐个相痊对章,提出了一种新的线性预测残差(LPR)域典型波形(PW)提取和块内插方法。该方法可以避免内插后的PCW分界处的不连续而引起的听觉上的失真,同时也使得PW分界的选择不对于太严格。借助于这种PW提取和块内插方法,本文实现了一种2.4kb/s线性预测编码方案,计算机模拟结果表明,该方案得到的重建语音与4.8kb/s码激励线性预测算法接近。 相似文献
9.
WI语音编码中相位信息的量化与重建 总被引:1,自引:0,他引:1
在低比特率语音编码中,人们往往认为人耳对相位信息不敏感而忽略了相位对语音质量的影响,导致语音粗糙、刺耳甚至音调发生改变.为了获得高质量的声码器,语音的相位信息是不能不考虑的.本文分析了一种利用感觉加权的相位谱分析合成(A-b-S)矢量量化方法,并在波形内插编码器中对SEW的相位信息进行量化,在合成端采用相位的三次多项式插值方法进行重建.实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度.主观A/B测试结果显示,该方法相比采用老年男子的固定相位法和基于最小相位模型的由幅度谱通过倒谱法重建相位谱的方法,经4~6个比特的相位量化可使合成语音质量得到显著的改善,尤其对女声,改善更为明显. 相似文献
10.
语音编解码技术现已成为通信技术的一个重要学科。本文在简要介绍通信训语音编码技术诉基础上,着重论述了参数编码的残差激励线性预测编码算法。这种线性预测编码是一种新的压缩方法,可使码率降低到2.4kb/s以下。 相似文献
11.
12.
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器. 相似文献
13.
Following a brief portrayal of the activities in 2.4-kbps speech coding, a wavelet-based pitch detector is invoked, which reduces the complexity of conventional autocorrelation-based pitch detectors, while ensuring smooth pitch trajectory evolution. This scheme is incorporated in a waveform-interpolated codec, which uses voiced-unvoiced (V/U) classification, and instead of simple Dirac pulses, an unconventional zinc basis function excitation is employed for modeling the voiced excitation. The required zinc-function parameters are determined in an analysis-by-synthesis loop, and for the sake of smooth waveform evolution and reduced complexity, a focused search strategy and a few further suboptimum restrictions are imposed without seriously affecting the speech quality. This baseline codec operates at a rate of 1.9 kbps, but it suffers from slight buzziness during the periods of excessive voicing. This impediment is then mitigated by invoking a mixed V/U multiband excitation, which slightly increases the bit rate to 2.35 kbps due to the transmission of the 3-b voicing strength code in each of the three excitation bands 相似文献
14.
该文提出了一种特征波形提取速率自适应于输入语音帧特性的波形内插编码方案。基于双加权长时预测增益最大原则并利用前向基音判决实现了较为可靠的基音周期估计算法,用基音周期、浊音度和波表面平坦度决定波形提取速率以及SEW(Slowly Evolving Waveform)和REW(Rapidly Evolving Waveform)的更新速率。实验证明,该文提出的波形内插(WI)编码算法相比固定波形提取速率的WI算法在平均码率和计算复杂度上均有一定程度的降低,且合成语音质量明显优于4.8kbps的CELP语音编码算法。 相似文献
15.
16.
在对LD-CELP语音编码标准和无损数据压缩算法LZH深入研究的基础上,提出了基于两者的一种语音混合压缩方法。实验结果表明,采用这种混合压缩方法可以将语音码率从64kbps降到9.6kbps左右,而且运算时间和处理延迟没有明显的增加。主观测试表明,恢复后的语音保持了自然度和可懂度,其主观质量是令人满意的。 相似文献
17.
18.
19.
提出了一种结合 MBE(多带激励 )模型和 LPC(线性预测编码 )模型的 1 .8kbps声码器 .在这种声码器中 ,采用 LPC特征参数来代表语音帧的频谱 ,利用 LPC残差进行基音提取和多带清浊音判决 ,采用 MBE模型合成语音 ,并在高频浊音带的语音合成中混以清音 .在定点 Mo-torola DSP560 0 2 EVM上 ,可以在 1 .8kbps的码率下对语音进行实时的编解码处理 ,具有存储量和计算量较小的特点 .其合成语音质量超过了 LPC- 1 0 e. 相似文献