期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

丁琦徐金甫王炳锡《信号处理》2005,21(Z1):176-179

本文提出了一种基于MELP编码器的速率可变的极低速率语音编码算法.该算法采用超级帧结构和参数联合矢量量化技术降低语音信号帧间的冗余度,利用超级帧中各帧线性预测滤波器的相似性,使用变速率语音编码技术降低平均比特率.文中定义了一个新的LSF距离测度,用来度量两组不同的LSF参数所表征的滤波器间的差别,并由距离测度决定每超级帧的速率.对算法解码语音质量的客观测试表明本文提出的语音编码算法可以在所使用的560bps和800bps两种速率下保持可接受的语音质量. 相似文献

2.

基于信号规整和稀疏变换的语音与音频分层编码方法

下载免费PDF全文

李晓明鲍长春贾懋 《电子学报》2015,43(7):1286-1293

基于语音和音频信号的固有周期性特征,本文构建了一种适合语音和音频信号的统一分析/合成模型,并分别在24kbps和32kbps码率下,实现了对宽带语音和音频信号的高质量分层编码.首先,本文将具有时变周期的输入信号规整为具有固定周期的信号,并对规整后的周期信号构建规整矩阵;其次,对规整矩阵的行和列分别进行调制叠接变换(MLT)和离散余弦变换(DCT),完成规整矩阵的稀疏化;最后,利用分带量化和矢量哈夫曼编码完成稀疏矩阵元素的量化和编码.主客观测试结果表明,本文所提方法的语音、音频及其混合信号的编码质量均优于同等速率下的ITU-T G.722.1和AMR-WB编码器. 相似文献

3.

基于DCT分带谱熵与信号分解的高精度基音检测算法 总被引：2，自引：0，他引：2

下载免费PDF全文

罗亚飞鲍长春《电子学报》2007,35(1):13-22

本文就低速率WI语音编码中的基音检测技术进行研究,针对基音检测在不同噪声与信噪比下容易发生清浊误判的问题,在基音检测前端引入基于DCT分带谱熵的语音检测算法划分语音段与非语音段;为了向基音检测算法提供更能准确反映基音周期实际变化的输入语音,基于谐波-噪声模型提出了一种改进的DCT域语音分解算法.然后,根据变形的MCAMDF(Modified Circular Average Magnitude Difference Function)与NCCF(Normalized Cross-Correlation Function)的峰值共性,结合上述两项基音检测前端处理技术,提出了MCAMDF-NCCF基音检测组合算法.为了满足不同环境下WI编码器对基音检测高精度的要求,在合成端更准确地恢复相位轨迹,本文又基于MCAMDF-NCCF算法提出了高精度MCAMDF-NCCF-FRAC基音检测算法以计算分数基音.将算法应用与2kb/s WI编码器,主观A/B听力测试结果表明,本文提出的基音检测算法在低信噪比下明显抑制了基音加倍减半及清浊误判现象的发生,得到了优异的基音检测结果,合成语音质量完全满足低速率WI编码器对基音检测技术的要求. 相似文献

4.

一种符合ITU-T指标要求的嵌入式立体声语音频编码方法

贾懋珅鲍长春《电子学报》2009,37(10):2291-2297

基于国际电信联盟标准化组织(ITU-T)编码标准G.729.1,本文提出了一种嵌入式变速率立体声语音与音频编码方法.本算法利用G.729.1和改进的调制叠接变换(Modulated Lapped Transform,MLT)编码技术对输入信号的中值与边带信息进行分层编码,形成具有嵌入式结构的码流.编码器可处理宽带和超宽带的立体声信号,宽带立体声信号编码的最大码率为48kb/s,超宽带立体声信号编码的最大速率为64kb/s.实现结果表明,本编码器的编码质量均达到了ITU-T对G.EV-VBR立体声编码的指标要求. 相似文献

5.

低速率语音编码技术

王嘉华《电信快报》1998,(2):8-12

本文以ITU最新公布的语音编码方案MP MLQ /ACELP为例 ,介绍低速率语音编码技术的发展 ,并将该方案和GSM系统的全速率语音编码方案进行比较 ,说明中低速率语音编码在技术和应用上的一些特点。相似文献

6.

采用经验模态分解的语音与音频通用编码方法

下载免费PDF全文

李晓明鲍长春《信号处理》2013,29(10):1274-1282

为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition, EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量化,以提升重建音频的主观听觉质量,并最终实现一套包含24kbps和32kbps码率的宽带语音与音频通用编码器;最后,对所提算法进行了客观PESQ/PEAQ和主观A/B测试,并与ITU-T G.722.1和G.722.2编码器进行了比较,实验结果表明,所提编码器对语音和音频信号的编码质量均优于参考编码器。相似文献

7.

一种4 kbit／s语音混合编码

程敏俞珑《江苏通信技术》2002,18(5):22-26

介绍了一种语音混合编码技术，它结合了频域参数编码器（用于平稳浊音和平稳清音）和时域波形编码器（用于过滤语音）。主观听音测试证明，这种4kbit/s混合编码方案的质量可和低速率的CELP编码器相媲美。相似文献

8.

语音编码技术进展

樊昌信《移动通信》1995,19(1):33-35

语音编码技术进展樊昌信一、语音编码的目的和应用语音编码是将模拟语音信号数字化的手段。语音信号数字化后，可以作为数字数据来传输、存储或处理，因而具有一般数字信号的优点。在实际应用中，这些优点是很重要的。１．数字语音信号在经过信道传输时，信道引入的噪声和... 相似文献

9.

一种新的语音二项式正弦脉冲激励方案

邓立新杨震等《电讯技术》2001,41(2):19-23

本文提出一种新的用于LPC语音编码器的BSP激励信号,即根据语音产生的原理,以一个幅度受到二项式调制的正弦波BSP（Binomial Sine Pulse)作为LPC激励源,该二项式反映了激励信号在一个基音周期内的变化趋势。本文同时推导了BSP激励参数的求取和改进方法。实验结果表明,在此基础上构造的BSP语音编解码器具有低复杂度、低时延的优点,同时编码速率在低至2．65kb/s时,具有较高的合成语音质量。相似文献

10.

CE—LPC在民航语音交换系统中的应用

李斯伟《中国数据通信网络》2000,(5):11-14

ＣＥ－ＬＰＣ称为码激励线性预测编码，它属于声编码器类。这类编码器从时间波形中提取重要的特征，它在低比特率编码器最适用。本通过ＣＥ－ＬＰＣ编码的特点、系统组成和编码原理等几个方面，说明民航语音交换系统采用ＣＥ－ＬＰＣ编码可在４．８ｋｂｉｔ／ｓ的速率上传输高质量的话音信号。相似文献

11.

ITU-T Recommendation G.729 Annex B: a silence compression schemefor use with G.729 optimized for V.70 digital simultaneous voice anddata applications

Benyassine A. Shlomot E. Su H.-Y. Massaloux D. Lamblin C. Petit J.-P. 《Communications Magazine, IEEE》1997,35(9):64-73

相似文献

12.

TETRA语音编码中基音预处理算法的优化 总被引：6，自引：0，他引：6

赵毅牟同升刘庆江宓磊《电路与系统学报》2003,8(1):105-108

本文在TETRA语音编码的预处理部分引入了数值滤波算法。该算法能够有效去除声道的共振峰结构对基音检测的影响，进一步试验采用去均值。低通滤波和数值滤波等算法来替代原有的预处理，可以得到更好的优化效果。我们设计了普通语音、基音有抖动的语音和带有噪声干扰的语音未检验优化算法的性能。在这两种优化算法中都可以发现处理后的语音信号在时域上表现出明显的周期性特征，同时在频域上原始语音的共振峰影响被消除或得到有效抑制。相似文献

13.

Channel and source considerations of a bit-rate reduction technique for a possible wireless communications system's performance enhancement

Ilk H.G. Tugac S. 《Wireless Communications, IEEE Transactions on》2005,4(1):93-99

In wireless commercial and military communications systems, where bandwidth is at a premium, robust low-bit-rate speech coders are essential. They operate at fix bit rates and those bit rates cannot be altered without major modifications in the vocoder design. A novel approach to vocoders, in order to reduce the bit rate required to transmit speech signal, is proposed. While traditional low-bit-rate vocoders code original input speech, the proposed procedure operates on the time-scale modified signal. The proposed method offers any bit rate from 2400 b/s to downwards without modifying the principle vocoder structure, which is the new NATO standard, Stanag 4591, Mixed Excitation Linear Prediction (MELP) vocoder. We consider the application of transmitting MELP-encoded speech over noisy communication channels by applying different modulation techniques, after time-scale compression is applied. Three different time-scale modification algorithms have been evaluated and waveform similarity overlap and add (WSOLA) algorithm has been selected for time-scale modification purposes. Computer simulation results, both source and channel, are presented in terms of objective speech quality metrics and informal subjective listening tests. Design parameters such as codec complexity and delay are also investigated. Simulation results lead to a possible wireless communications system, whose performance might be enhanced by using the spared bits offered by the procedure. 相似文献

14.

Pitch synchronous differential predictive encoding system

Xydeas C.S. Steele R. 《Electronics letters》1976,12(15):376-378

A pitch synchronous differential predictive encoding system (p.s.d.p.e.) is described, which reduces the dynamic range of voiced speech to a value similar to that of unvoiced speech. As a consequence, the signal encoded has a smaller dynamic range than the speech signal and results in an improvement in the signal/noise ratio for a given transmitted number of bits per sample. This improvement is approximately 8 dB compared with an a.d.p.c.m. codec, when the p.s.d.p.e. system uses an adaptive p.c.m. encoder and the transmission rate is 3 bit/sample. 相似文献

15.

结合深度卷积循环网络和时频注意力机制的单通道语音增强算法

下载免费PDF全文

闫昭宇王晶《信号处理》2020,36(6):863-870

语音增强的目的是从带有噪声的语音中分离出纯净语音，实现语音的质量和可懂度的提高。近年来，采用有监督学习的深度神经网络已经成为了语音增强的主流方法。卷积循环网络是一种新型的神经网络结构，包含编码层、中间层、解码层三个主要模块，其已经在语音增强任务中取得了较好的效果。时频注意力机制是一个由数个相连的卷积层通过跳跃连接构成的简单网络模块，在训练过程中可以计算语音幅度谱特征图的非邻域相关性，从而更加有利于网络关注到语音的谐波特性。本文将时频注意力机制引入卷积循环网络的编码层和解码层中，实验结果表明，在不同信噪比条件下，该方法相比基线卷积循环网络能够进一步提高语音质量和可懂度，且增强后的语音信号可以保留更多的语谱谐波信息，实现更低程度的语音失真。相似文献

16.

一种基于GSM的低码率语音信息隐秘传输方法

程义民郭志川谢春辉谢于明《电路与系统学报》2008,13(2):83-88

本文描述了一种将一路低码率2．4kb／s混合激励线性预测（MELP）语音信息隐藏在另一路GSM编码的语音中,通过公共信道隐秘传输的方法。可将机密数据嵌入GSM语音中对人耳不敏感的比特,每（2L＋1）可修改比特,可嵌入2三比特数据而最多只修改其中的三比特,具有较高的嵌入率。隐藏在GSM语音中的低码率信息码率最高可达3．4kb／s。该方法,计算复杂度不高,易于硬件实现,从而可满足实时隐秘传输的要求。该方法已用微型机在局域网进行了模拟实验,获得了较好的结果。相似文献

17.

Pitch synchronous 1st-order linear d.p.c.m. system

Xydeas C.S. Steele R. 《Electronics letters》1976,12(4):93-95

A system called p.s.f.o.l.d. is described which exploits the correlation between successive pitch periods of a speech signal. This system is a differential one and can employ various types of encoders. We describe a p.s.f.o.l.d. system using a 1st-order d.p.c.m. encoder and show that for a speech utterance this system has a peak signal/noise ratio which is 6 dB larger, and has an increase in dynamic range of 13 dB, compared with a 1st-order d.p.c.m. codec. 相似文献

18.

基于改进阈值函数的小波包语音增强算法的研究 总被引：4，自引：1，他引：3

段其昌邓玉娟应泽贵《通信技术》2009,42(5):86-88

基于小波分析的阈值语音信号去噪技术是语音信号处理的一个重要热点技术,由于语音信号的非平稳性,传统的小波阈值去噪算法虽然能够衰减一部分语音信号中的噪声,但这些算法会不可避免地造成有用语音信号的损失。小波包可以同时对语音的低频和高频部分进行分解,能更好保留语音信息,减少噪声对语音的影响;同时,文中提出一种新的阈值函数,它对噪声清除得更加干净。仿真结果显示,该阈值函数较软、硬阈值函数具有明显的优越性。相似文献

19.

基于HHT和OSF的复杂环境语音端点检测

卢志茂金辉张春祥任明溪《电子与信息学报》2012,34(1):213-217

希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。相似文献

20.

Running average error reduces overload noise in delayed delta-modulation systems

G. S. TOMBRAS C. A. KARYBAKAS 《International Journal of Electronics》2013,100(6):1105-1115

A simple but effective method to reduce overload noise and improve the overall performance in delta-modulation (DM) systems is presented in this paper. Two identical DM encoders operate on a different time-basis in such a manner that a running average of the error signal from the first encoder is taken into consideration by the second one. The resulting operation is a time adaptation process yielding diminished overload noise during overload bursts. Results obtained by computer simulation for speech signals show an overall signal-to-quantization noise ratio (SQNR) improvement up to 2.5 dB at optimum step size over classical schemes. 相似文献