共查询到19条相似文献,搜索用时 62 毫秒
1.
该文提出了一种码率为 0.75-5.4kb/s可变速率的高质量语音编码讲法。该算法对CELP的激励进行了改进,根据语音的特征把语音分成4类,不同类型的语音采用不同的激励码本。特别是对于浊音,提出了一种基于基音同步的嵌入分裂式激励码本,该码本利用浊音具有准周期性的特点,使该算法在很低的码率下就可很好地恢复浊音信号,克服了CELP在4kb/s速率以下因码本尺寸小而导致合成语音质量差的缺点。经非正式听音测试,它的主观质量超过了1~8kb/s的可变速率QCELP系统,并且平均速率大约只有2kb/s,比QCELP的5kb/s平均速率低了很多、非常适用于 CDMA移动通信系统。 相似文献
2.
分析了现有正弦语音模型基音周期检测算法的缺陷,提出一种改进算法。该算法改变了候选基音周期选择策略,大大降低了基音周期搜索时间;同时采用一种基于时域的前向滤波算法,解决了基音周期检测中的倍频问题。最后对实际采集的语音数据进行分析。 相似文献
3.
低速率WI编码器中4~6bit基音量化算法研究 总被引:1,自引:0,他引:1
基音在语音编码中通常采用7bit无失真均匀量化。由于浊音段语音的基音普遍具有缓慢渐变的特点,为了更有效地去除前后帧基音之间存在的相关性,该文基于Eriksson和Kang提出的4bit基音量化算法,针对汉语语音进行研究,实现了一套4~6bit基音量化算法。该算法计算简单,无需码书存储。将此基音量化方案应用于WI模型和WI编码器,主观A/B听力测试结果表明,该方案在高效量化基音的同时保证了合成语音质量几乎没有损失,完全满足低速率WI编码器对量化基音的要求。 相似文献
4.
一种改进的混合激励线性预测的基音周期估计算法 总被引:4,自引:0,他引:4
本文详细讨论了混合激励线性预测(MELP)的基音周期估计算法及其改进算法.该算法采用了分数基音周期、倍数检测等技术,保证了基音周期估计的精度.同时又采用了滑动窗的方法,使得对基音周期不规则的不平稳的语音段进行基音周期估计时的误差减小.本文最后给出了该算法的测试结果及优缺点. 相似文献
5.
本文针对汉语是声调语言的特点,提出了一种提取基音周期的新方法,该方法快速、准确,可广泛应用于汉语语音处理中的四声判别及话音识别,在我们开展的《话音确认系统的研究》课题中得到有效应用。 相似文献
6.
一种600bps极低速率语音编码算法 总被引:1,自引:0,他引:1
该文针对抗干扰通信中对低速率语音编码算法的应用需求,提出了一种600bps极低速率语音编码算法,采用6帧超帧结构,超帧中包括2个基本帧与4个插值帧。插值帧的线性预测(LPC)参数采用基于闭环最优一阶线性预测的4阶段残差矩阵量化;在解码端,提出了闭环的激励脉冲幅度估计方法,提高了合成语音的自然度与鼻音音节的清晰度。该算法可以提供良好的合成语音质量,DRT测试结果达到88.55分。 相似文献
7.
本文针对汉语是声调语言的特点,提出了一种提取基音周期的新方法,该方法快速、准确,可广泛应用于汉语语音处理中的四声判别及话音识别,在我们开展的《话音确认系统的研究》课题中得到有效应用。 相似文献
8.
一种基于线性预测与自相关函数法的语音基音周期检测新算法 总被引:8,自引:1,他引:8
阐述了一种新的基于语音线性预测模型和经典自相关函数法的基音周期检测算法。该算法的特点在于着重对被处理语音进行滤波预处理和平滑后处理。它克服了自相关法在对低信噪比的语音信号检测时常出现半倍频误差的缺点,同时又克服了对某些变化曲线较大的语音信号检测时随机错误较多的问题。实验表明,在噪声环境下.这种处理方法能够提高传统自相关基音检测法的可靠性和准确性。 相似文献
9.
基音周期是语音压缩、合成以及识别中的一个重要参数.传统的基于AMDF的基音估计算法容易导致估计的基音周期加倍.本文针对该现象,分析了AMDF函数的特性及其用于基音检测时存在的不足,提出了新的CAMDF函数.CAMDF有效地克服了AMDF函数的不足,简化了基音检测过程.在此基础上,本文给出了新的基于CAMDF的基音检测算法.该算法不仅简化了基音检测过程,而且降低了误判率,提高了估计精度.大量实验表明其性能优于其它AMDF或LVAMDF的方法. 相似文献
10.
通过对常规语音信号处理分析,设计一种基于倒谱法的基音周期检测改进算法.其过程是先对语音信号进行预处理、去趋势项处理及去噪声处理,,然后通过语音分析中的线性化处理、伯格算法和中值滤波算法对预处理过的语音信号进一步优化,并利用仿真软件验证改进增强算法,改进算法可有效的减少外界环境及共振峰等因素的干扰,相对于常规的语音基音检测算法其鲁棒性、稳定性更强. 相似文献
11.
12.
13.
一种用于WI语音编码的相位预测式矢量量化方法 总被引:1,自引:0,他引:1
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。 相似文献
14.
提出了利用庞加莱截面检测语音信号基音的方法,通过延时重构语音信号的相空间,在相空间内计算通过某点的庞加莱截面,根据相轨迹穿过截面上初始点邻域交点进行基音检测;实验表明,基于庞加莱截面的语音信号的方法,描述语音信号的非线性特性具有较高的准确性和时间分辨率。 相似文献
15.
This correspondence describes a new quantization technique called hybrid adaptive quantization (HAQ) that uses instantaneous [1], [2] as well as syllabic [3] adaptation of the step size. Two types of instantaneous adaptive algorithms have been used-Jayant's adaptive quantizer (JAQ) and the incremental adaptive quantizer (IAQ). Computer simulations have been performed for a sine-wave, correlated Gaussian signal and digitized speech. Signal-to-noise ratio (SNR) computation for PCM and DPCM coders indicates that the hybrid technique is superior to the normal adaptive quantizer, when both have the same ratio of maximum to minimum step size. 相似文献
16.
17.
18.
提出了一种新颖的基于高斯混合模型(GMM)的甚低码率语音编码系统.该编码器利用GMM对短时语音谱包络进行拟合的方法来对语音进行参数化表示.编码时,语音经预处理、分帧加窗后,再经FFT分析得到分帧语音的信号频谱,并获得平滑谱包络.然后采用GMM对谱包络进行拟合,用GMM参数(均值、方差、权重)对语音谱加以表示.由于GMM参数较少,从而可以使得码率甚低.解码时,根据编码逆运算生成谱包络,浊音信号利用正弦模型加以合成,清音信号经IFFT合成.实验仿真结果表明:该编码器在传输码率降低到2.35 kb/s时,仍可获得音质令人满意的解码语音. 相似文献
19.
Design algorithms and simulation results are presented for vector quantizers for Fourier transformed data. Transforming the data prior to quantization has two potential advantages. First, each sample in the transform domain depends on many samples in the original domain. Thus, even scalar quantization in the transform domain is a form of vector quantization or block source coding in the original waveform domain and the basic coding theorems of information theory show that such block codes can provide better performance than scalar codes, even for memoryless sources. Second, vector quantization of Fourier transformed speech waveforms provides distinctly better subjective quality than ordinary vector quantization of the waveform using codes of comparable complexity. While the system is, of course, more complicated due to the need to take Fourier transforms, its envisioned application is as a coder for the output of FFT chips currently available or under development. The proposed implementation of a Fourier transform vector quantizer (FTVQ) uses a product code structure, providing different codes for different coefficient vectors corresponding to different frequency bands. This is a form of subband coding and yields a simple means of optimizing bit allocations among the subcodes. Two coding structures with corresponding distortion measures are considered: those that quantize vectors of pairs of real and imaginary coefficients and those that quantize separate vectors of magnitude and phase coefficients. Both structures yield good performance for the given complexity in comparison to waveform vector quantizers. For speech coding, a magnitude-phase FTVQ yields better subjective quality than a real-imaginary FTVQ when the rate allocation is properly chosen. 相似文献