期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李晓明鲍长春《信号处理》2013,29(10):1274-1282

为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition, EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量化,以提升重建音频的主观听觉质量,并最终实现一套包含24kbps和32kbps码率的宽带语音与音频通用编码器;最后,对所提算法进行了客观PESQ/PEAQ和主观A/B测试,并与ITU-T G.722.1和G.722.2编码器进行了比较,实验结果表明,所提编码器对语音和音频信号的编码质量均优于参考编码器。相似文献

2.

基于奇异值分解的低速率波形内插语音编码算法 总被引：8，自引：7，他引：1

下载免费PDF全文

王贵平鲍长春张鹏《电子学报》2006,34(1):135-140

波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器. 相似文献

3.

低速率WI语音编码器中LP残差信号的SVD分解及量化

王贵平鲍长春《信号处理》2005,21(Z1):156-159

波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文在波形内插语音编码算法基础上,提出了一种基于奇异值分解(SVD)的LP残差信号的分解与量化方法,减少了算法的延时,提高了分解精度.在分解模型中,将CW分成基本矩阵、过渡矩阵和补充矩阵,并采用不同的量化方法,有效地降低了运算复杂度;在量化过程中,引入周期因子和能量熵来衡量CW周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbpsSVD-WI编码器的重建语音质量略好于2.4kbpsMELP编码器. 相似文献

4.

高质量鲁棒600BPS甚低速率语音编码算法 总被引：3，自引：0，他引：3

邹霞陈亮张雄伟《信号处理》2003,19(Z1):109-112

本文提出了一种600bps高质量鲁棒语音编码算法,该算法采用多帧参数分类联合矢量量化、动态比特分配、参数内插和参数相关预测等技术降低语音编码速率.为了提高算法的抗信道误码能力,算法采用了鲁棒的矢量量化.非正式主观试听表明该算法的合成语音质量优于传统的2.4kbps线性预测(LPC-l0e)语音编码算法,接近于2.4kbps的MELP,并且该算法在1%的随机误码信道条件下仍然具有良好的可懂度. 相似文献

5.

一种符合ITU-T指标要求的嵌入式立体声语音频编码方法

贾懋珅鲍长春《电子学报》2009,37(10):2291-2297

基于国际电信联盟标准化组织(ITU-T)编码标准G.729.1,本文提出了一种嵌入式变速率立体声语音与音频编码方法.本算法利用G.729.1和改进的调制叠接变换(Modulated Lapped Transform,MLT)编码技术对输入信号的中值与边带信息进行分层编码,形成具有嵌入式结构的码流.编码器可处理宽带和超宽带的立体声信号,宽带立体声信号编码的最大码率为48kb/s,超宽带立体声信号编码的最大速率为64kb/s.实现结果表明,本编码器的编码质量均达到了ITU-T对G.EV-VBR立体声编码的指标要求. 相似文献

6.

一种基于多描述编码技术的高质量音频编码算法

张璐《数字技术与应用》2010,(11):74-76

本文依据感知音频编解码基本原理，研究和设计了一种基于多描述编码技术的高质量音频编码算法。这种算法具有较好抗丢包性能，算法的总体思路是先在分析与合成的层面上把音频分解为听觉掩蔽门限和剩余信号，然后在量化和编码层面上分别对音频的听觉掩蔽门限和剩余信号进行多描述处理。姑果表明，在所提出的多描述抗丢包音频编解码算法框架下，多描述算法的抗丢包性能明显优于单描述的抗丢包性能，标量量化多描述算法的抗丢包性能比奇偶分离双描述算法和对偶变换双描述算法的抗丢包性能都要好。相似文献

7.

基于离散余弦变换的波形内插语音编码算法 总被引：2，自引：0，他引：2

下载免费PDF全文

刘靖宇鲍长春李如玮《电子学报》2009,37(7):1599-1605

针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果. 相似文献

8.

语音和音频统一编码技术的分析和测试

林珍吓钱慧余轮《有线电视技术》2015,(1):49-51

MPEG-D语音和音频统一编码(UnifiedofSpeechandAudioCoding,USAC)标准是一种新兴的MPEG音频标准,其核心目标是力求在低比特速率下,能同时对语音信号、音乐信号、语音和音乐混合的信号进行有效编码。目前USAC编码系统主要由频率域和线性预测域两个核心编码模块组成,并通过信号分类器进行控制。本文首先对USAC系统的总体架构进行主要介绍,然后分析构造窗函数以实现输入信号中语音信号和音频信号的分解,最后利用matlab仿真工具对USAC系统的编码性能进行测试和分析。相似文献

9.

面向窄带通信的极低速率语音编码算法研究

下载免费PDF全文

刘斌陶建华莫福源《信号处理》2013,29(9):1134-1141

提出了一种面向窄带通信的极低速率参数语音编码算法。在2.4kbps MELP标准的基础上结合听觉感知,对线谱对参数进行联合矢量量化、对基音周期进行内插和非线性量化、对能量参数进行高效压缩,可以使语音数据在0.5kbps下匀速传输;线谱对参数的预测残差用于矢量量化,这是一种提高合成语音的音质的有效方法。实验结果表明,采用本文提出的语音编码算法可以使语音数据在极低码率下有效的传输,解码端合成的语音具有较高的可懂度。相似文献

10.

基于稀疏编码的语音增强方法研究 总被引：1，自引：0，他引：1

凌洁刘琚赵彩华杜军《电路与系统学报》2008,13(6)

本文利用带噪语音经特征基函数矩阵转换后所具有的稀疏特性,用最大似然估计方法对转换后得到的稀疏分量进行非线性压缩去噪,然后再经过反变换和重构恢复出原始语音信号的估计.特征基函数矩阵反映了语音数据本身的统计特性,因此具有很好的合理性和可取性.仿真结果表明利用稀疏编码方法能极大程度地抑制背景噪声,与小波消噪法相比优势明显. 相似文献

11.

基于LD-CElP和LZH的低比特率语音编码方法

拉玖姚天任《通信技术》2000,(3):78-81

在对ＬＤ－ＣＥＬＰ语音编码标准和无损数据压缩算法ＬＺＨ深入研究的基础上,提出了基于两者的一种语音混合压缩方法。实验结果表明,采用这种混合压缩方法可以将语音码率从６４ｋｂｐｓ降到９．６ｋｂｐｓ左右,而且运算时间和处理延迟没有明显的增加。主观测试表明,恢复后的语音保持了自然度和可懂度,其主观质量是令人满意的。相似文献

12.

一种改进的MELP语音编码方法 总被引：1，自引：0，他引：1

华国刚戴蓓蒨张钦李辉《电路与系统学报》2003,8(1):101-104

目前2.4kbps的混合激励线性预测（MELP）语音编码方法已经被确定为美国新的联邦语音编码标准。本文提出了一种改进的MELP语音编码方法，利用滤波器相似度和基于LPC系数分类的矢量量化技术，可以把MELP的码率降到1.7kbps以下，仍有较好的合成语音质量。相似文献

13.

基于GMM的甚低码率语音编码器

李平曾毓敏吴婷婷吴华玉《光电子技术》2007,27(2):110-114

提出了一种新颖的基于高斯混合模型(GMM)的甚低码率语音编码系统.该编码器利用GMM对短时语音谱包络进行拟合的方法来对语音进行参数化表示.编码时,语音经预处理、分帧加窗后,再经FFT分析得到分帧语音的信号频谱,并获得平滑谱包络.然后采用GMM对谱包络进行拟合,用GMM参数(均值、方差、权重)对语音谱加以表示.由于GMM参数较少,从而可以使得码率甚低.解码时,根据编码逆运算生成谱包络,浊音信号利用正弦模型加以合成,清音信号经IFFT合成.实验仿真结果表明:该编码器在传输码率降低到2.35 kb/s时,仍可获得音质令人满意的解码语音. 相似文献

14.

Codage audio haute qualité (20 Hz-15 kHz) en sous bandes à débit réduit (64 kbit/s) et à faible retard (5 ms)

Samir Saoudi Karine Hay Laurent Mainard 《电信纪事》1999,54(5-6):267-280

In this paper, we present a new method for high quality audio coding at low delay and low bit rate for telecommunications applications such as audioconfe-rence or videoconference. The developped coder is adapted to code generic audio signals at a bit rate of 64 kbit/s with a delay close to 5 ms in the 20-15000 Hz bandwidth. The method is based on speech coding as well as audio coding concepts. The coder combines subband decomposition of the input signal and LD-CELP techniques. We introduce in this structure of coding a psychoacoustic model which allows to allocate an optimal bit rate on each subband according to perceptual properties of the human hearing. In order to satisfy the bit rate requirement of the psychoacoustic model and to reduce the complexity of such a coding algorithm, we suggested a new method of vector quantization based on lattice quantization. This method allows to quantify the residual signal in the LD-CELP coder and avoid the complexity of the full search. Objective and subjective tests have been made on a test set of audio signals which is a critical sub-set used by ISO. Formal tests showed that the quality of the proposed coder is comparable to the best implementation of the MPEG-1, Layer II, but our solution has the advantage of reaching a very low delay (5 ms). 相似文献

15.

基于ACELP的嵌入式语音编码算法 总被引：1，自引：0，他引：1

范睿鲍长春李锐《通信学报》2007,28(10):48-54

为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相比,实现的编码器能够获得具有嵌入结构的码流,不仅能够保证核心层的合成语音质量,而且在增强层也取得了与对应速率的现有标准编码器相当的合成语音质量。相似文献

16.

High-quality audio transform coding at 64 kbps

Mahieux Y. Petit J.P. 《Communications, IEEE Transactions on》1994,42(11):3010-3019

This paper presents a transform coding algorithm devoted to high quality audio coding at a bit rate of 64 kbps per monophonic channel. It enables the transmission of a high quality stereo sound through the basic access (2B channels) of ISDN. Although a complete system including framing, synchronization and error correction has been developed, only the bit rate compression algorithm is described here. A detailed analysis of the signal processing techniques such as the time/frequency transformation, the pre-echo reduction by adaptive filtering, the fast algorithm computations, etc., is provided. The use of psychoacoustical properties is also precisely reported. Finally, some subjective evaluation results and one real time implementation of the coder using the ATT DSP32C digital signal processor are presented 相似文献