首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法   总被引:3,自引:1,他引:2       下载免费PDF全文
郭莉莉  鲍长春 《电子学报》2009,37(5):1146-1153
 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Characteristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW 的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当.  相似文献   

2.
薛二娟  鲍长春  李如玮 《电子学报》2010,38(7):1574-1579
 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.  相似文献   

3.
王贵平  鲍长春 《信号处理》2005,21(Z1):156-159
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文在波形内插语音编码算法基础上,提出了一种基于奇异值分解(SVD)的LP残差信号的分解与量化方法,减少了算法的延时,提高了分解精度.在分解模型中,将CW分成基本矩阵、过渡矩阵和补充矩阵,并采用不同的量化方法,有效地降低了运算复杂度;在量化过程中,引入周期因子和能量熵来衡量CW周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbpsSVD-WI编码器的重建语音质量略好于2.4kbpsMELP编码器.  相似文献   

4.
基于奇异值分解的低速率波形内插语音编码算法   总被引:8,自引:7,他引:1       下载免费PDF全文
王贵平  鲍长春  张鹏 《电子学报》2006,34(1):135-140
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2.4kbps MELP编码器.  相似文献   

5.
张鹏  鲍长春 《信号处理》2005,21(Z1):160-163
WI编码器中特征波形(CW-Characteristic Waveform)的分解与量化一直是该编码器研究的热点问题.传统的WI编码器将残差信号表示为渐变的特征波形,然后通过线性相位非因果FIR低通滤波器把CW分解为慢渐变波形和快渐变波形,分别表示语音的准周期成分和类噪声成分.这种分解方法不仅不能完全去除SEW与REW之间的相关性,而且还增加了额外一帧的延时,本文通过对现有的基于奇异值分解(SVD-Singular Value Decomposition)的特征波形分解方法的研究,深入剖析了CW奇异值分解后U、∑和V的物理意义,并提出一种有效降低SVD复杂度的算法.  相似文献   

6.
基于离散余弦变换的波形内插语音编码算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘靖宇  鲍长春  李如玮 《电子学报》2009,37(7):1599-1605
 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果.  相似文献   

7.
高质量的4 kb/s散布脉冲CELP语音编码算法   总被引:11,自引:0,他引:11  
鲍长春 《电子学报》2003,31(2):309-313
本文提出了一种散布脉冲CELP(DP-CELP)语音编码算法,激励矢量由特殊结构的代数码书与固定形式的散布脉冲的卷积获得,这种激励源有效地改善了重建语音质量,但未增加代数码书搜索的复杂度.非正式的主观听力测试表明,这种4 kb/s DP-CELP语音编码算法的合成语音质量非常接近G.723.1中6.3 kb/s语音编码器.  相似文献   

8.
一种用于WI语音编码的相位预测式矢量量化方法   总被引:1,自引:0,他引:1  
陈悦  鲍长春 《电子与信息学报》2007,29(11):2672-2675
在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。该文在散布相位矢量量化方法的基础上进一步去除了相位冗余,在波形内插(Waveform Interpolation,WI)编码模型中对相邻帧慢渐变波形(Slowly Evolving Waveform,SEW)的相位谱差值进行预测式矢量量化。实验发现,该方法大大改善了重建语音效果,明显提高了语音的自然度和清晰度。主观A/B测试结果显示,该方法与固定相位法相比,经4~6 bit的相位量化可使合成语音质量得到显著的改善,相比散布相位矢量量化方法,女声的语音合成质量有所改进。  相似文献   

9.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短,合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法.在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9.  相似文献   

10.
4kb/s有限状态代数码激励线性预测语音编码算法FS-ACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP)参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FS-ACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CS-ACELP,MOS分约为3.9.  相似文献   

11.
语音特征波形的分解与量化   总被引:1,自引:0,他引:1  
王贵平  鲍长春  李靓 《电声技术》2005,(1):50-54,58
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视。基于波形内插(WI)语音编码算法,全面总结和分析了现存的特征波形分解和量化的方法,这将为该领域的研究人员提供重要的参考。  相似文献   

12.
基于DCT分带谱熵与信号分解的高精度基音检测算法   总被引:2,自引:0,他引:2       下载免费PDF全文
本文就低速率WI语音编码中的基音检测技术进行研究,针对基音检测在不同噪声与信噪比下容易发生清浊误判的问题,在基音检测前端引入基于DCT分带谱熵的语音检测算法划分语音段与非语音段;为了向基音检测算法提供更能准确反映基音周期实际变化的输入语音,基于谐波-噪声模型提出了一种改进的DCT域语音分解算法.然后,根据变形的MCAMDF(Modified Circular Average Magnitude Difference Function)与NCCF(Normalized Cross-Correlation Function)的峰值共性,结合上述两项基音检测前端处理技术,提出了MCAMDF-NCCF基音检测组合算法.为了满足不同环境下WI编码器对基音检测高精度的要求,在合成端更准确地恢复相位轨迹,本文又基于MCAMDF-NCCF算法提出了高精度MCAMDF-NCCF-FRAC基音检测算法以计算分数基音.将算法应用与2kb/s WI编码器,主观A/B听力测试结果表明,本文提出的基音检测算法在低信噪比下明显抑制了基音加倍减半及清浊误判现象的发生,得到了优异的基音检测结果,合成语音质量完全满足低速率WI编码器对基音检测技术的要求.  相似文献   

13.
针对多径信道下低信噪比直扩信号扩频序列的盲估计问题,提出一种通过码片延迟与相关矩阵分析相结合的方法实现扩频波形估计。该方法首先将接收信号延迟一段时间与原信号相乘,然后代入自相关矩阵中,通过特征值分解求得最大特征值及其对应的特征向量,通过该特征向量中的零点确定同步位置并恢复扩频序列。理论分析和仿真结果表明,本算法在低信噪比条件下能完成对PN码序列的精确估计。  相似文献   

14.
本文介绍了一种高速DDS芯片—DS856的工作原理和性能特点,利用FPGA对其进行配置产生宽带调频信号和点频连续波信号.该芯片能够直接产生L波段信号和更大带宽调频信号,为宽带波形产生提供了一种新途径.  相似文献   

15.
针对单频连续波干扰极易通过频域滤波加以抑制,而宽带连续阻塞式干扰又存在干扰效率低下的问题,提出脉冲连续波这种新的宽带梳状拦阻式干扰样式。根据C/A码、P(Y)码和M码信号功率谱特点分别设置脉冲连续波的干扰频率覆盖范围。以码跟踪误差作为干扰效果评估指标,对不同干扰环境下采用窄带非相干延迟锁定环的GPS接收机码跟踪性能进行仿真分析。仿真结果表明:脉冲连续波干扰对不同伪随机噪声码(PRN)编号和副载波调制相位下的C/A码和M码信号影响是不同的,在相同干信比(JSR)条件下,脉冲连续波的干扰效果要优于宽带高斯噪声和匹配谱干扰。  相似文献   

16.
研究了时延估计算法在超宽带(Ultra Wide Band)定位中的应用,其广义相关自适应时间延迟估计算法的收敛速度慢,在低信噪比条件下时间延迟估计精度较低。针对低信噪比条件下的收敛特性,提出一种最大似然加权的广义相关自适应时间延迟估计算法,并进一步提出了改进的基于最大似然(Maximum Likelihood)加权函数的广义互相关时延估计算法。改进的算法采用加窗法和自适应时变干扰删除滤波法,弥补了原算法计算量大及无法消除时变信号干扰的不足。仿真结果表明,改进的算法计算复杂度明显降低,能够有效地消除其他信号干扰,具有较高的时延估计精度和鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号