首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 500 毫秒
1.
为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG:Fuzzy-LBG);采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

2.
为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法。利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式。对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量。测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能。  相似文献   

3.
针对语音中清音和浊音特性的不同,本文提出了一种新的清浊音判别方法,利用K奇异值分解(K singular value decomposition,KSVD),分别对数据样本中的清音和浊音进行字典学习,训练出符合样本信号特性的浊音字典和清音字典,将多个单清音字典组合成组合清音字典,多个单浊音字典组合成组合浊音字典,并将待测信号在组合浊音字典和组合清音字典上进行稀疏表示,通过对比其系数的稀疏性来判别清浊音。研究结果表明,在相同条件下,与传统的清浊音判别方法相比,基于组合字典的判别方法对于多音素的清浊音判决具有更加准确的判决结果。该研究对语音识别和语音编码具有重要作用。  相似文献   

4.
评价一个参数对于划分语音信号成清浊音段的有效性是十分困难的问腰.为解决此问题,提出了一种基于粒计算的语音信号清浊音检测算法.该算法利用粒的理论对清浊音检测中用到的8种语音信号的特征参数进行分析,构造决策表,计算得出各参数对清浊音判决的重要度.最终选用参数组合MFCC(Mel.Frequence Ceptral Coefficients)、小波互相关、小波系数和短时自相关进行语音实时分段,得到多参数结合的求解最优路径.进一步提取决策规则并进行多参数清浊音分段,试验表明获得了好的效果:对于纯净语音分段算法的准确率达到平均93.86%,对于带噪语音准确率达到平均90.27%.此外算法的处理帧长仅为20样点,意味着有很好的实时性.  相似文献   

5.
介绍多带激励(MBE)模型原理、分析和合成,该算法突破了二元激励的局限性,较好的解决了简单二元激励模型导致的合成语音自然度不够以及抗噪声能力差的问题,是目前低速率语音编码较理想的方案.此外,详细阐述了MBE编码器的仿真实现方法,并给出了程序流程和仿真结果.实验结果表明,此仿真系统合成的语音在频谱和波形上都和原始语音比较接近,并具有良好的清晰度和可懂度,任何熟悉的人都可以辨别说话人.  相似文献   

6.
在当前网络状况下,高效的语音压缩编解码器可节省网络传输带宽,解决网络拥挤问题.通过对语音特性的分析,结合共扼结构代数码本激励线性预测(conjugate structure algebraic code excited linear prediction,CS-ACELP)算法,提出了一种运算量较小但行之有效的话音激活检测算法,设计出了一种基于TMS320VC5409数字信号处理器的语音压缩编解码器.实验结果表明,利用该语音压缩编解码器可将平均比特率降低到约4 kb/s,能很好地满足VoIP中全双工实时语音通信的要求,得到了较好的实际效果.  相似文献   

7.
为了对语音帧的清浊音属性进行判断,本文提出了一种基于快速样本熵的清浊音判决和语音分割方法。通过计算英语单音素发音的样本熵,可以发现清浊音的信号复杂度有明显的区别,并根据复杂度的不同来进行清浊音的判决。同时,在快速算法中将数值二值化,由低维信号矢量的近邻矩阵递推高维信号矢量的近邻矩阵,可以快速有效的进行语音分割,并进行仿真实验。仿真结果表明,与其他传统方法相比,基于样本熵的方法可以得到较好的语音分割结果,而且快速样本熵算法将运算时间缩短了80倍,明显减少了运算时间,提高了运算效率。该研究在语音信号方面具有较好的应用前景。  相似文献   

8.
混响语音信号包括由路径延迟效应引起的不同频率分量,这些频率分量在频域中进行相关调制.为了降低混响语音在频谱中的高相关性,提出了一种基于加性频域分解的改进生成对抗网络(generative adversarial net-work,GAN)算法.首先,对混响语音的短时幅度谱进行对数运算,将调制的混响语音幅度谱转换为线性幅...  相似文献   

9.
小波去噪在语音识别中的应用   总被引:7,自引:1,他引:6  
将小波应用于语音识别的预处理中,对带噪语音信号在小波域内区分语音的清,浊音,分别用门限进行不同的处理,将去噪后的小波系数反变换后再进行语音识别。实验结果表明,小波去噪对在噪声环境下的语音识别性能有很大的改进。  相似文献   

10.
本文详细介绍改进型多带激励(IMBE)语音编码算法,在语音分析过程,重点介绍了自适应门限的清/浊判决法,在参数编码过程,重点介绍了谱参数的编码方法.本文最后给出了软件模拟的实验结果.  相似文献   

11.
为降低码书的存储空间和搜索复杂度,更充分地利用线谱频率参数帧内和帧间的相关性,提出了一种快速、低存储的矢量量化器。将线谱频率参数去除平均值后进行一阶滑动平均预测,将残差进行三级矢量量化。在第二级量化时,将高维线谱频率参数矢量分裂成两个低维的部分,分别用不同的码书进行量化,降低了码书的存储空间和搜索复杂度。C语言仿真结果显示,在满足低速率编码的前提下,平均谱失真达到0.91dB,2~4dB的谱泄露为0.13%,无4dB以上谱泄露,同时码书的存储空间和搜索复杂度均降低了31%以上。  相似文献   

12.
MBE声码器的基音估计研究   总被引:2,自引:0,他引:2  
主要对NBE声码器了研究,简单介绍了MCIBE编解码算法的基本原理。NBE编码基于3个参数(基音周期、谱包络参数、以及每个频带的U/V判决信息)的提取,其中基音周期的估计准确性将直接影响到语音的合成质量;文中重点分析了基音估计部分;考虑到在实际应用中可能会出现的基音错锁问题,提出了一种改进的基音估计算法。改进算法不但可以省略基音平滑这一过程,简化了整个算法过程;而且改善了基音周期的帧间连续性,并提高了语音合成的自然度。  相似文献   

13.
4.8kbps多带激励语音编码器的模拟实现   总被引:1,自引:0,他引:1  
文章阐述了多带激励(MBE)语音产生模型与以往单一激励语音产生模型的区别及其优越性。研究了以MBE模型为基础进行语音分析合成的基本原理和实现的算法。提出了4.8kbpsMBE语音编码方案,并在计算机上进行了模拟实现。实验结果表明,所模拟的4.8kbpsMBE语音编码器系统是成功的。其合成语音在可懂度与自然度方面,与以往的线性预测(LPC)、码激励线性预测(CELP)语音编码系统相比都有了明显的改善。  相似文献   

14.
一种高效、低存储的线谱频率参数矢量量化器   总被引:2,自引:1,他引:1  
为了降低线谱频率(LSF)参数矢量量化器的搜索复杂度和码字存储单元,利用LSF参数的帧内和帧间相关性,设计了一种LSF参数的预测式多级分裂矢量量化器.该量化器对LSF参数的预测残差矢量进行两级矢量量化,其中第2级的误差矢量分裂成2个维数分别为4和6的子矢量进行矢量量化,采用瞬时联合多级矢量量化器设计算法设计码本,应用M-L树搜索算法搜索码字,降低了搜索复杂度和码字存储单元,在20 bit时,平均谱失真小于1 dB.  相似文献   

15.
提出一种基于高斯混合模型和多项式拟合的语音编码改进算法. 在GMM模型对短时语音谱包络进行参数化的基础上,将一定数量的语音帧划分为一个片段,利用谱特征的相关性对片段内的GMM参数进行多项式拟合联合编码,从而使得参数进一步减少. 仿真结果表明,本文算法码率对比基于GMM的语音编码器有显著降低.  相似文献   

16.
在低速率声码器中,对激励信号的描述直接影响重建语音的质量. 为了改善音质,提出一种基于语音截止频率的声码器激励模型. 该模型编码时通过语音截止频率将激励谱分成谐波和噪声2个子带,谐波子带的激励谱幅度引入离散余弦变换变维模型进行描述,语音截止频率进行4 bit非线性量化. 解码时将恢复出的谐波子带激励谱幅度进行傅里叶反变换,噪声子带则由白噪声进行以语音截止频率为阻带截止频率的高通滤波,最后由谐波子带和噪声子带叠加出激励. 实验结果表明,该模型提高了全带激励谱幅度和谐波噪声成分的描述精度,可使重建语音的音质得以明显改善,主客观指标更优,对男声更为突出.  相似文献   

17.
针对语音信号在离散余弦变换基上的稀疏性,提出了一种基于压缩感知的语音压缩编码算法。算法在编码端采用随机高斯矩阵直接对语音波形进行观测,并采样均匀量化技术对随机观测进行量化。解码端利用未饱和的观测值通过Lasso算法实现语音信号的重构。仿真结果表明,该算法具有良好的重构性能。  相似文献   

18.
通过分析移动通信电路域语音信道的结构特点,提出了一种适用于移动通信电路域信道的抗语音声码器断续传输(DTX)处理和有损压缩的语音信息隐藏算法.选择经语音端点检测判决为浊音帧的有效语音信号进行3级小波分解,选择第3级小波细节系数做快速傅里叶变换(FFT)后,在表征频带0.5~1 kHz的FFT系数上根据听觉掩蔽理论对秘密信息进行量化抖动调制嵌入,实现秘密信息在语音中的隐藏.实验结果表明,该算法模型在10 bit/s上限容量时,携密语音质量评价分数高于3.48,经过全球移动通信系统增强型全速率声码器的DTX技术处理、有损压缩以及信道中存在的其他干扰后,误码率保持在0.06左右.  相似文献   

19.
In order to improve the accuracy of the voiced/unvoiced/silence classification, a new method based on the Stack Autoencoder (SAE) is proposed. This method is implemented with a deep neural network composed of SAE and Softmax. First, the SAE is trained with the unsupervised method using a speech parameter training sequence which includes the residual signal peak, gains, pitch periods, and line spectrum frequency (LSF), while the Softmax is trained with supervision by the use of the output of the SAE with the speech parameters training sequence as its training input. Then a supervised fine-turning method to the deep neural network is conducted to obtain the final parameters of the networks. Test results have shown that the accuracy of the speech classification of the presented method is better than the traditional methods in different background noise conditions with different signal-to-noise ratios (SNR), especially in the low SNR condition.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号