期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

田雨刘晓明冯晓荣《计算机应用研究》2011,28(6):2123-2129

在标准混合激励线性预测(MELP)语音编码算法中,对同时含有清音和浊音的混合帧会产生参数估计错误,并且导致合成语音质量的下降。针对这个缺陷提出一种基于过渡帧判决算法的改进MELP模型(M-MELP),提高了参数估计的准确度,保证了合成语音的质量,并结合TMS320C6416数字信号处理器的结构特点,通过改写开源的MELP算法实现M-MELP算法,从程序结构、编译器和代码进行三级优化。相对于单一的优化,能更好的提高程序运行的并行性和存储器的访问效率,从而在基于DSP的嵌入式系统中实现高质量的实时语音编码。相似文献

2.

一种基于重构性深度网络的MELP语音编码改进算法

张雄伟吴海佳张梁梁邹霞《数据采集与处理》2015,30(2):307-318

为了提高深度模型的编码重构性能,本文为传统对比散度(Contrastive divergence,CD)添加了基于交叉熵的重构误差约束。利用改进后的算法训练了重构性深度自编码机(Reconstructive deep auto encoder,RDAE),并用RDAE替换混合激励线性预测编码(Mixed excitation linear prediction, MELP)语音编码器中 LSF参数的矢量量化方法。测试结果表明,改进后的算法在损失一定模型似然度的条件下获得了重构性能的提升,当RDAE隐藏层结点设为19　bit时,本文方法所测得的加权LSF距离、重构语音质量、谱失真指标在训练集和测试集上均优于25　bit矢量量化方法,即利用本文方法改进的MELP编码器,在不降低语音质量的条件下,可将MELP编码速率从2.4　kb/s降低至2.1　kb/s,编码速率降低了12.5%。相似文献

3.

LPC-10e到MELP语音编码转换

下载免费PDF全文

陈峰吴玉成《计算机工程与应用》2011,47(33):159-161

针对在采用LPC-10e和MELP两种不同的语音编码算法标准的通信系统中实现相互通信,提出一种从LPC-10e语音编码到MELP语音编码的参数直接转换方案,实现LPC-10e语音编码的基音周期、清浊音判决参数等转换成MELP语音编码相应参数。仿真结果表明,参数直接转换方案不仅提高了合成语音质量,而且降低了15%左右的编码运算量。相似文献

4.

一种多媒体通信语音编码器算法及其实时实现

李昕陈健《电子技术应用》1999,25(5):41-43

首先介绍了ITU（国际电信联盟）为多媒体通信制订的一种5．3／6．3Khps双速率语音编码标准G．723．1的算法原理,着重讨论了两种速率下的激励矢量搜索技术,然后叙述了作者在用C语言对该算法进行仿真和研究的基础上采用TMS320C541定点DSP实时实现该编解码的过程。主现测评合成语音达到通信质量,整个编解码器运算复杂度为27．7MIPS。相似文献

5.

1.6Kb/s类MELP语音压缩编码器的FPGA实现 总被引：2，自引：0，他引：2

郭立 WANG Miao-feng 刘璐 YU Li 李琳《小型微型计算机系统》2008,29(8)

基于"CPU软核模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性. 相似文献

6.

一种改进的LPC语音编码方法

杜可越李辉戴蓓倩陆伟《计算机应用》2003,23(1):86-88

文中提出了一种改进的LPC语音编码方法，利用某些语音段声道变化缓慢的特性和基于似然比失真来判断LPC系统相似度，可以把LPC的码率降到1．7Kbps以下，而且仍有较好的合成语音质量。相似文献

7.

SMV语音编码算法及仿真

宁更新方敏群韦岗《计算机工程与应用》2003,39(29):84-86

介绍了第三代通信系统中的可选模式语音声码器(SMV)语音编码方式,简要描述了SMV的编、解码基本原理。并进行了该算法的定点C代码仿真,给出了算法的性能、计算复杂度及存储空间等仿真结果。相似文献

8.

新型宽带语音编解码器AMR-WB的研究 总被引：1，自引：0，他引：1

焦传斌于保华李治柱《计算机仿真》2005,22(1):150-152,159

该文介绍了一种应用于第三代移动通讯系统的编解码器,同时也是第一个可同时用于无线和有线应用的编解码器,该编解码器的语音带宽拓展为50Hz到7000Hz,编码后语音的自然度很高,用在3G移动通讯系统的多媒体服务、宽带包交换网络、音频和视频会议等等。由于AMR-WB为一个全新的宽带编解码器,其标准在2001年3月刚刚通过,国外对其的研究也属于起步阶段,还没有真正进入实用阶段。尤其在国内,至今尚未见到相关的研究。故对其进行全面的分析和深入的研究是必要的,会对今后的研究打下良好的基础。相似文献

9.

MELP解码器系统的FPGA实现 总被引：1，自引：0，他引：1

下载免费PDF全文

韩琼磊郭立杨帆高路《计算机工程与应用》2009,45(9):74-76

低比特率混合激励线性预测（MELP）算法的复杂性使得MELP声码器系统的实时实现比较困难。根据MELP声码器的算法,提出了一种新的基于现场可编程门阵列（FPGA）实现整个解码器系统的单片方案,并在FPGA平台上完成了对整个系统的验证。该系统主要包括NiosII微处理器和自定义IP模块,通过自定义IP弥补了NiosII处理器运算能力的不足。实验结果表明,实现了MELP解码系统的实时处理。相似文献

10.

一种改进的线性预测语音编码技术及实现 总被引：1，自引：1，他引：1

下载免费PDF全文

纪友芳刘桂斌《计算机工程与应用》2009,45(15):163-165

线性预测编码是实现语音编码的一项重要技术,介绍了线性预测编码技术的实现,提出一种改进型的声激励线性预测语音编码方法。最后,将简单LPC语音编码与声激励LPC语音编码进行比较。实验结果表明,该方法能够很好地实现语音编码,声音效果也比简单LPC更理想。相似文献

11.

低延迟低码率语音编码研究

下载免费PDF全文

赵哲峰张刚谢克明王一平《计算机工程与应用》2008,44(34):100-102

现有的低延迟语音编码算法（LD-CELP）需要16 kb/s比特率,无疑会妨碍它的应用。提出了一种采用两阶段码书搜索的方法可以在提高低延迟语音编码算法性能的同时降低码率。首先构造了两个子码书：一个后向更新的自适应码书和一个具有代数结构的固定码书;然后设计了两阶段码书搜索方法使滤波后的激励矢量和目标矢量之间的均方误差保持最小。这样就得到了一个在8 kHz采样率下具有2.5 ms延迟的10 kb/s两阶段码书搜索的CELP编码器。用平均分段信噪比（SSNR）和感知语音质量评价（PESQ）测试,本算法具有和16 kb/s的G.728相当的编码质量。相似文献

12.

低速率语音编解码专用处理器设计

宋辉崔慧娟唐昆《微计算机信息》2006,22(26):19-21

本文给出一种基于编码速率600bps的高质量声码器算法的专用处理器设计。介绍了语音编解码算法原理,专用处理器的体系结构,汇编器的开发和算法的移植。采用软硬件协同设计的方法,大大降低了算法的存储复杂度和运算复杂度,并在电路中验证了声码器地正确性。相似文献

13.

一种无门限U/V判决和基音检测算法 总被引：1，自引：1，他引：0

下载免费PDF全文

姜占才姚刚《计算机工程与应用》2011,47(25):140-142

在实验研究自相关法（ACF）和平均幅度差法（AMDF）基音检测性能的基础上,提出了一种无门限清/浊音判决和基音检测算法。该算法对语音帧分别计算AMDF和LPC残差信号的自相关（LACF）,比较两种方法所得的基音,得出清/浊音判决结果和浊音帧的基音周期。只用一次逻辑判断,无需比较门限;在多种声码器上应用该算法进行语音编/解码仿真实验,表明判决和检测算法具有较高的准确性和较强的噪声鲁棒性。相似文献

14.

Bayesian AD coder: Mesh-aware valence coding for multiresolution meshes

Junho Kim 《Computers & Graphics》2011,35(3):713-718

The Alliez Desbrun (AD) coder has accomplished the best compression ratios for multiresolution 2-manifold meshes in the last decade. This paper presents a Bayesian AD coder which has better compression ratios in connectivity coding than the original coder, based on a mesh-aware valence coding scheme for multiresolution meshes. In contrast to the original AD coder, which directly encodes a valence for each decimated vertex, our coder indirectly encodes the valence according to its rank in a sorted list with respect to the mesh-aware scores of the possible valences. Experimental results show that the Bayesian AD coder shows an improvement of 8.5-36.2% in connectivity coding compared to the original AD coder despite of the fact that a simple coarse-to-fine step of the mesh-aware valence coding is plugged into the original algorithm. 相似文献

15.

一种改进的语音质量感知评估算法

下载免费PDF全文

黄石磊刘轶程刚《计算机工程》2012,38(18):19-21

为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。相似文献

16.

低速语音编码中的预测分类分裂矢量量化技术* 总被引：1，自引：0，他引：1

马庆利季新生杨于村《计算机应用研究》2009,26(10):3700-3702

为降低编码速率的同时仍能提供较好的谱失真性能,提出了一种预测分类分裂矢量量化算法,它根据线谱对的特点,融合了预测、分类、分裂的方法对线谱对进行量化,加入了记忆性。实验证明与其他几种方法相比,该算法的量化性能在速率与失真间达到了较好的平衡,且计算量大大降低,仅占有内存有所增加。相似文献

17.

一种用于语音编码的快速自适应码书搜索算法

下载免费PDF全文

王艳黄建国李钒《计算机工程与应用》2007,43(15):69-71

码激励线性预测技术（简称CELP）能够在低比特率的情况下实现较高质量的语音,但其运算复杂度高。自适应码书搜索替代长时预测,是大多CELP编码方案的关键。介绍了CELP的基本原理并讨论了自适应码书搜索算法,提出将一种快速自适应码书搜索算法引入到传统4.8 kbp FS1016使其复杂度明显降低。仿真结果表明,该方法既保持了4.8 kbs FS1016传统算法复原语音的质量,又使自适应码书搜索运算量下降约40％以上。相似文献

18.

Monaural speech separation based on MAXVQ and CASA for robust speech recognition 总被引：1，自引：0，他引：1

Peng Li Yong Guan Shijin Wang Bo Xu Wenju Liu 《Computer Speech and Language》2010,24(1):30-44

Robustness is one of the most important topics for automatic speech recognition (ASR) in practical applications. Monaural speech separation based on computational auditory scene analysis (CASA) offers a solution to this problem. In this paper, a novel system is presented to separate the monaural speech of two talkers. Gaussian mixture models (GMMs) and vector quantizers (VQs) are used to learn the grouping cues on isolated clean data for each speaker. Given an utterance, speaker identification is firstly performed to identify the two speakers presented in the utterance, then the factorial-max vector quantization model (MAXVQ) is used to infer the mask signals and finally the utterance of the target speaker is resynthesized in the CASA framework. Recognition results on the 2006 speech separation challenge corpus prove that this proposed system can improve the robustness of ASR significantly. 相似文献