共查询到17条相似文献,搜索用时 265 毫秒
1.
在混合激励线性预测(MELP)语音编码算法中,语音帧的突变转换导致合成语音质量的下降成为一个突出问题。为解决该问题,提出一种基于过渡帧判决算法的改进MELP模型,提高了参数估计的准确度,有效实现了语音的降噪处理。引入动态清浊音判决(U/V判决)门限将语音帧分为3种类型:浊音帧、清音帧、过渡帧,通过区分过渡帧和清浊音帧,避免了传统的U/V判决错误和清浊音帧的突变转换。给出了改进MELP编码参数比特分配表,通过PESQ—MOS测试表明,合成语音质量尤其是高频女声合成语音质量有了明显的改进。 相似文献
2.
在标准混合激励线性预测(MELP)语音编码算法中,对同时含有清音和浊音的混合帧会产生参数估计错误,并且导致合成语音质量的下降。针对这个缺陷提出一种基于过渡帧判决算法的改进MELP模型(M-MELP),提高了参数估计的准确度,保证了合成语音的质量,并结合TMS320C6416数字信号处理器的结构特点,通过改写开源的MELP算法实现M-MELP算法,从程序结构、编译器和代码进行三级优化。相对于单一的优化,能更好的提高程序运行的并行性和存储器的访问效率,从而在基于DSP的嵌入式系统中实现高质量的实时语音编码。 相似文献
3.
针对在采用LPC-10e和MELP两种不同的语音编码算法标准的通信系统中实现相互通信,提出一种从LPC-10e语音编码到MELP语音编码的参数直接转换方案,实现LPC-10e语音编码的基音周期、清浊音判决参数等转换成MELP语音编码相应参数。仿真结果表明,参数直接转换方案不仅提高了合成语音质量,而且降低了15%左右的编码运算量。 相似文献
4.
5.
为了提高深度模型的编码重构性能,本文为传统对比散度(Contrastive divergence,CD)添加了基于交叉熵的重构误差约束。利用改进后的算法训练了重构性深度自编码机(Reconstructive deep auto encoder,RDAE),并用RDAE替换混合激励线性预测编码(Mixed excitation linear prediction, MELP)语音编码器中
LSF参数的矢量量化方法。测试结果表明,改进后的算法在损失一定模型似然度的条件下获得了重构性能的提升,当RDAE隐藏层结点设为19 bit时,本文方法所测得的加权LSF距离、重构语音质量、谱失真指标在训练集和测试集上均优于25 bit矢量量化方法,即利用本文方法改进的MELP编码器,在不降低语音质量的条件下,可将MELP编码速率从2.4 kb/s降低至2.1 kb/s,编码速率降低了12.5%。 相似文献
6.
7.
8.
1.6Kb/s类MELP语音压缩编码器的FPGA实现 总被引:2,自引:0,他引:2
基于"CPU软核 模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性. 相似文献
9.
一种DCT域的音频信息隐藏方法 总被引:6,自引:0,他引:6
基于信息隐藏技术,提出并实现了一种语音保密通信的新方法。首先将保密语音进行混合激励线性预测(MELP)编码,形成隐藏信息;然后对公开语音信号作分段DCT变换,隐藏信息通过量化处理嵌入到DCT域的中频点;解码器在同样的嵌入点盲提取出隐藏信息,最后经MELP解码恢复保密语音。实验结果表明该算法在隐藏信息后,信道中传输的公开语音具有透明性,并且在受到压缩、滤波等攻击时具有较高的鲁棒性。 相似文献
10.
11.
12.
讨论了低码率语音编码MELP的编解码过程,有效降低了语音编码码率并能使说话者个人语音特征减弱,特别适合需要弱化说话者语音特点的场合.给出了其FPGA的硬件实现框图,据此可进行具体的硬件设计.同时给出了MELP编解码框图,可用于进一步的软件编制. 相似文献
13.
以降低码率为目的对G.728算法进行改进,提出了一个延迟为2.5 ms的8 Kbit/s的语音编码算法。算法引入了由最近的历史激励构成的自适应码书和归一化的固定码书的双码书结构。计算增益真值并量化,增益量化时对自适应码书用固定量化,固定码书用自适应量化。码书搜索时先进行后向基音检测,在基音周期T附近对自适应码书进行精细搜索。搜索64个自适应码矢、256个固定码矢和各自8个增益值获得最佳激励,每帧耗费20 bit。用平均分段信噪比和感知语音质量评价(PESQ)测试,改进算法编码质量接近于G.728。 相似文献
14.
Robust low bit rate speech coders are essential in commercial and military communication systems. They operate at fixed bit rates and those bit rates cannot be altered without major modifications in the vocoder design. In this paper we introduce a scaled speech coder, which operates on time-scale modified input speech. The proposed method offers any bit rate from 2400 b/s to downwards without modifying the principle vocoder structure, which is the mixed excitation linear prediction (MELP) vocoder. We consider the application of transmitting MELP-encoded speech over noisy communication channels after time scale compression is applied. Computer simulation results, both source and channel, are presented in terms of objective speech quality metrics and informal subjective listening tests. A statistical tool called bootstrap is also used to determine the accuracy of these test results. Design parameters such as codec complexity and delay are also investigated. 相似文献
15.
基于语音参数模型的语音隐藏算法 总被引:13,自引:0,他引:13
基于语音参数模型,该文提出一种将保密语音隐藏在公开语音中的信息隐藏算法.首先将保密语音经混合激励线性预测(MELP)编码和纠错编码形成隐藏信息.然后根据瞬态互相关基音周期检测算法确定频域嵌入点,并通过修改对应的DFT系数来隐藏信息.提取时按同样方法确定嵌入点恢复隐藏信息,并经MELP解码还原保密语音.实验结果表明嵌入信息后,中间语音的分段平均信噪比接近60dB,并且在受到压缩、滤波等攻击时具有较强的鲁棒性.算法为信息安全和数字水印领域研究开辟了一条新的途径. 相似文献
16.
传统熵编码算法复杂度高,且硬件实现较难。为此,提出一种易于FPGA硬件实现的无链表零树图像编码改进算法,该算法结合LZC和SPIHT算法的特点,增加了对孙子节点的判断,克服SPIHT算法中内存消耗大、复杂度高以及LZC算法中图像重建质量下降等缺点。采用该算法的编码器在对任意尺寸图像进行5层小波变换时,所需缓存固定为1 536 bit,远小于SPIHT算法。在相同比特率的情况下,图像重建质量PSRN值比LZC算法平均提高约0.7 dB。在Xilinx Virtex4 LX100硬件平台上进行实验,结果表明,当时钟频率为100 MHz、压缩率为1/40时,该算法处理1 600×1 200×24 bit图像的速度可达20 f/s。 相似文献
17.
针对H.264编码方案,提出了一种实时的无需二次编码的低码率宏块级码率控制策略。为克服H.264码率控制模型的缺陷,首先提出了平均像素信息比特(APIB)的概念及其码率控制模型;然后在宏块层,根据各个宏块不同的编码复杂度进行准确的码字分配;接着通过APIB的变化来自适应地更新码率控制模型的系数;最后提出了完整的基于宏块的码率控制算法,并将其在JVT的JM85平台上实现。试验结果表明,与H.264中的码率控制算法JVT-G012相比,该算法不仅在控制精度上平均提高了0.171kbps,而且峰值信噪比平均提高了0.227dB,同时还较好地控制了输出码率和峰值信噪比的波动。 相似文献