共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
本文介绍了一种具有32kb/s、24kb/s、16kb/s三种传输速率的ADPCM系统。该系统在32kb/s速率采用了G.721算法;在24 kb/s和16kb/s速率,保留了G.721的预测部分,采用了针对语音的最佳量化算法和能改善语音主观质量的噪声谱成形技术。通过计算机模拟确定了系统量化和谱成形的最佳参数,给出了变速率系统量化和预测性能的变化曲线。本文最后介绍了用单片TMS32010实时实现变速率系统的软硬件结构、设计技巧以及部分实测结果。 相似文献
3.
该文提出了一种码率为 0.75-5.4kb/s可变速率的高质量语音编码讲法。该算法对CELP的激励进行了改进,根据语音的特征把语音分成4类,不同类型的语音采用不同的激励码本。特别是对于浊音,提出了一种基于基音同步的嵌入分裂式激励码本,该码本利用浊音具有准周期性的特点,使该算法在很低的码率下就可很好地恢复浊音信号,克服了CELP在4kb/s速率以下因码本尺寸小而导致合成语音质量差的缺点。经非正式听音测试,它的主观质量超过了1~8kb/s的可变速率QCELP系统,并且平均速率大约只有2kb/s,比QCELP的5kb/s平均速率低了很多、非常适用于 CDMA移动通信系统。 相似文献
4.
介绍ADPCM标准、RLPC编码原理,编、解码器方框图及工作过程。民航卫星通信网TES系统为节省卫星转发器频率资源对传输的语音信号进行压缩处理,其信道单元基带信号处理器对语音信号进行CCITT推荐的G.721-ADPCM编码和修斯公司专利技术开发的RLPC编码处理,将64 kb/s语音数字信号压缩至32 kb/s,16 kb/s,9.6 kb/s传输,实现语音质量满足一般通信要求的低速率语音信号传输。 相似文献
5.
6.
7.
高质量4~8kb/s变速率有限状态ACELP语音编码算法研究 总被引:3,自引:0,他引:3
4~8kb/s变速率有限状态代数码激励线性预测语音编码(VR-FS-ACEL)是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,其中4kb/s的合成语音质量超过了北美8kb/s VSELP,接近长途质量,而6kb/s和8kb/s合成语音质量达到了长途质量,与G.7298kb/s CS-ACELP相当. 相似文献
8.
人机语声通信的重要方面之一是语声应答系统。线性预测编码(LPC)声码器技术被广泛应用在该系统以及各种语音合成器中。它能够使语音数字信号的比特率从64kb/s降至2.4kb/s,并具有较好的合成声音。但是这种LPC声码器最大的缺点是合成声自然感较缺乏。在2.4kb/s LPC声码器中,自相关格型滤波器被用来估计语音的声道参数。本文把Friedlander的前置窗格型算法应用到声码器中,提出了一种新的LPC声码器:前置窗LPC声码器。该声码器中的语音分析器是用前置窗格型滤波器对语音信号进行块处理;综合器是由本文导出的前置窗格型逆滤波器构成。该方法通过抽取一组偏向关系数和辅助参数,提高声道参数估计值的精确性,因此在比特率和计算量略有增加的代价下,可获得声码器性能的改善。计算机模拟试验结果可以得到初步的结论:前置窗LPC声码器的合成声音质量比2.4kb/s“自相关”LPC声码器有一定的改善。 相似文献
9.
低速率和高质量一直是语音编码算法的研究方向。文章借鉴HVXC、CELP和MELP算法的长处,提出一种新的2kb/s语音编解码算法。非正式主观测试表明,与2kb/s的HVXC和2.4kb/sMELP算法相比,该算法的清晰度和自然度都有不同程度的提高。 相似文献
10.
高质量的4 kb/s散布脉冲CELP语音编码算法 总被引:11,自引:0,他引:11
本文提出了一种散布脉冲CELP(DP-CELP)语音编码算法,激励矢量由特殊结构的代数码书与固定形式的散布脉冲的卷积获得,这种激励源有效地改善了重建语音质量,但未增加代数码书搜索的复杂度.非正式的主观听力测试表明,这种4 kb/s DP-CELP语音编码算法的合成语音质量非常接近G.723.1中6.3 kb/s语音编码器. 相似文献
11.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短,合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法.在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9. 相似文献
12.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s
FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9. 相似文献
13.
本文研究了一种新型的语音多序列激励线性预测(MSLPC)模型。它将激励用有限个长时规则序列表示。MSLPC激励模型中的长时特征使它能较好地利用语音浊音中的长时多余度,并能推出快速搜索算法。 本文在介绍了MSLPC模型的基本概念后,重点讨论了MSLPC激励参数的块模式最大互关快速搜索算法,以及激励序列幅度矢量的两种乘积码矢量量化(VQ)的设计。实验结果表明,MSLPC模型能用于实现在2.4 kb/s至4.8 kb/s速率段的低速率语音编码。 相似文献
14.
一、宽带综合业务内容 1.语音通信:8kb/s-64kb/s(2.4kb/s)2.立体声:128kb/s-256kb/s3.可视电话:64kb/s-128kb/s(1kb/s)4.数字电视:1.5Mb/s~15Mb/s(MPEG-1,MPEG-2) 相似文献
15.
低比特率话音编码:≤13kb/s,有些≤8kb/s。显然,低比特率话音编码提高了每MHz和每基地台的用户数。但是,它也大大降低了语音质量,在穿过网络时不允许话音编码汇接。即是说,当低比特率语音代码转换成另一种不同的编码形式如许多网络使用的64kb/s时,或从一端IS—54电话到另一端GSM或IS—95电话时,话音质量急剧下降。对车辆移动用户来说,这种情况下除了中止通信别无选择,这个问题并不严重。 相似文献
16.
17.
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative Matrix Factorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器. 相似文献
18.
19.
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法. 相似文献
20.
本文讲述一种集若干种语音技术与图像、数据设备为一体的数字电话会议系统设计和实施。目的在于提供多种学易用的先进通信性能。此系统称为HuMa Net,即“人机网络”。它完全由自然语音控制,人机交互通信免手操作。此会议系统把语音识别、文本合成、讲话者识别等技术与自动定向话筒阵、图像压缩、数据和大型文本管理相结合,通过基本速率ISDN(综合业务数字网)提供优质话音加图像的电话会议业务。目前的公用交换传送容量可提供2B+D条信道,即2条64kb/s的电路交换信道(2B)和1条16kb/s分组交换信道(1D)。 相似文献