共查询到17条相似文献,搜索用时 171 毫秒
1.
改进的符合EV-VBR标准的嵌入式宽带语音编码器 总被引:3,自引:0,他引:3
基于国际电信联盟标准化组织(ITU-T)嵌入式变比特率(EV-VBR)编码标准提案,在本实验室开发的候选编码器基础上提出了一套改进的嵌入式变速率宽带语音编码方法.本算法在前2层使用代数码激励线性预测(ACELP)编码,增加计算量化了中间子帧谱参数,设计实现了三脉冲深度优先树搜索算法;在后3个编码层,本算法使用累积频域系数矢量的方式重新构建了嵌入式变换域编码(TCX).此外,改进编码器还实现了语音激活检测(VAD)和非连续传输(DTX)功能.相关测试表明,改进编码器较原编码器,语音质量有明显改善,编码复杂度显著降低,编解码质量和效率与最新的G718标准接近,并保持了低延迟的优点. 相似文献
2.
3.
针对传统码激励线性预测(Code Excited Linear Predictive,CELP)语音编码器在预测模型和参数估计方面的不足,提出了一种基于零极点预测模型的CELP语音编码新算法。该算法采用零极点预测模型来更准确地描述语音信号的短时相关性,并采用梯度法来同时对零极点模型的参数和激励码本增益进行联合优化求解。实验结果表明所提语音编码算法可显著降低CELP编码器合成语音的归一化均方误差,有效提高合成语音的质量。 相似文献
4.
5.
该文基于代数码激励线性预测(ACELP)语音编码算法提出了非均匀和部分搜索域代数码书。非均匀代数码书由代数码书的脉冲非均匀统计特性确定,部分搜索域代数码书则由代数码书矢量的周期性确定,该方法有效地弥补了低比特率情况下代数码书中脉冲数不足的缺点。在使用上述两项技术时,为保持基音的连续性,该编码器对语音段和非语音段采用了不同的基音估计方法。主观和客观的听力测试表明,当该技术应用于4kb/s 散布脉冲码激励线性预测(DP-CELP)语音编码器时,重建语音的质量得到明显改善,尤其是对女性讲话者。 相似文献
6.
基于国际电信联盟标准化组织(ITU-T)编码标准G.729.1,本文提出了一种嵌入式变速率立体声语音与音频编码方法.本算法利用G.729.1和改进的调制叠接变换(Modulated Lapped Transform,MLT)编码技术对输入信号的中值与边带信息进行分层编码,形成具有嵌入式结构的码流.编码器可处理宽带和超宽带的立体声信号,宽带立体声信号编码的最大码率为48kb/s,超宽带立体声信号编码的最大速率为64kb/s.实现结果表明,本编码器的编码质量均达到了ITU-T对G.EV-VBR立体声编码的指标要求. 相似文献
7.
高质量的4 kb/s散布脉冲CELP语音编码算法 总被引:11,自引:0,他引:11
本文提出了一种散布脉冲CELP(DP-CELP)语音编码算法,激励矢量由特殊结构的代数码书与固定形式的散布脉冲的卷积获得,这种激励源有效地改善了重建语音质量,但未增加代数码书搜索的复杂度.非正式的主观听力测试表明,这种4 kb/s DP-CELP语音编码算法的合成语音质量非常接近G.723.1中6.3 kb/s语音编码器. 相似文献
8.
9.
10.
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法. 相似文献
11.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s
FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9. 相似文献
12.
13.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短,合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法.在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9. 相似文献
14.
This letter proposes a new embedded speech coding structure based on the Adaptive Multi‐Rate Wideband (AMR‐WB) standard codec. The proposed coding scheme consists of three different bitrates where the two lower bitrates are embedded into the highest one. The embedded bitstream was achieved by modifying the algebraic codebook search procedure adopted for the AMR‐WB codec. The proposed method provides the advantage of scalability due to the embedded bitstream, while it inevitably requires some additional computational complexity for obtaining two different code vectors of the higher bitrate modes. Compared to the AMR‐WB codec, the embedded coder shows improved speech qualities for two higher bitrate modes with a slightly increased bitrate caused by the decreased coding efficiency of the algebraic codebook. 相似文献
15.
16.