首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
语音信号去混响原理与技术   总被引:1,自引:0,他引:1  
语音信号去混响技术在通信、语言识别等方面有重要应用。介绍了国内外相关研究动态和方法,阐述了声音混响过程和倒谱法去混响原理,简要介绍了传声器阵列-倒谱法去混响技术。  相似文献   

2.
一种适用于混响环境的麦克风阵列语音增强方法   总被引:5,自引:1,他引:4  
在小型视频会议系统中,影响语音处理系统性能的主要因素是房间混响效应.现有语音增强方法大都采用加性噪声模型,没有考虑混响;而基于倒谱的语音去混响方法大多计算复杂.为此,本文给出了一种改进的麦克风阵列倒谱域语音去混响方法.该方法首先计算含噪语音倒谱域的最小相位分量,并对其进行波束形成,再进行低通滤波;然后利用人耳对相位信息的不敏感性,采用含噪语音的相位来合成增强后的语音信号,从而有效地降低了运算量.仿真结果表明,该方法在混响环境下能有效地改善语音质量.  相似文献   

3.
提出了一种基于复超高斯分布的多通道联合去噪去混响波束形成器。本文采用复超高斯模型对语音信号建模,在最大似然准则下首次推导出联合去噪去混响波束形成器的解析表达式,并证明了该式是现有多种联合去噪去混响波束形成器的一般化形式。同时通过理论推导证明本文所提算法性能优于传统多通道预测误差算法级联最小功率无失真波束形成器。仿真实验与实际实验结果均表明,本文提出的算法在多个客观指标上明显优于现有联合去噪去混响算法。   相似文献   

4.
赵红  李双田 《信号处理》2014,30(9):1018-1024
在相对封闭的空间内,使用一些通讯设备时,距离声源较远的麦克风接收到的语音信号通常会被混响和噪声所污染,这些干扰信号会在很大程度上降低语音可懂度。带噪的混响语音经过去混响和消噪算法处理后,常常会残留一些音乐噪声,使得人耳听起来很不舒服。本文根据人耳对不同频带的听觉特征,引入Gammatone听觉滤波器组,提出了Gammatone滤波器修正的多级线性预测去混响算法。实验结果证明,新算法有效的解决了去混响及消噪后的残留音乐噪声问题,提高了语音的清晰度和舒适度。   相似文献   

5.
赵红  李双田 《信号处理》2014,30(6):674-682
在一个封闭的空间内,距离声源较远时接收到的语音信号通常会被混响所污染,其中晚期混响会在很大程度上降低语音可懂度。一般的去噪方法只能去除常见的加性噪声如白噪声,并不能去除房间冲激响应与干净语音卷积而成的混响,因此需要专门的去混响算法来去除晚期混响带来的影响。本文提出了一种新算法,在多级线性预测单通道去混响算法的基础上,修正了其预白化过程,改进后的算法可以提升语音前两个共振峰。实验结果证明,新算法在去除大部分混响的同时能够保留更多的有用语音的低频成分,因而提高了语音可懂度。   相似文献   

6.
梅铁民 《信号处理》2018,34(7):776-786
噪声鲁棒的自适应语音信号去混响是现代语音信号处理的重要研究内容,其困难在于语音信号的非白性、非平稳性及房间的超长冲激响应特性。针对单输入多输出(SIMO)麦克风阵列系统获取的多路混响语音信号,提出了一种新的去混响算法。首先通过相关法时延估计对SIMO混响语音信号进行时延对齐;其次在保持SIMO系统输出信号间交叉关联关系(cross relation)基础上对混响语音信号进行预白化处理;最后把交叉关联关系、用于矩阵最小特征向量计算的反幂法与卡尔曼滤波解卷积方法有机结合,实现了SIMO混响语音信号的实时自适应去混响。仿真与实验研究表明,本方法对混响语音信号去混响效果明显,同时具有较好的抗噪声性能。   相似文献   

7.
由于麦克风采集到的语音信号常常受到通信环境噪声及混响的干扰,致使语音质量受到严重的影响。因此,文章提出了一种新的麦克风阵列语音增强方法。仿真结果表明,相对于传统的麦克风阵列语音增强方法而言,文章所提出的方法具有更好的去噪效果。  相似文献   

8.
为解决语音通信中的混响干扰问题,提出了一种基于最小相位分解的,可用于单通道语音的去混响方法。根据信号最小相位分解的原理,将接收到的含噪带混响的语音信号分解成最小相位部分和全通部分,对其中的最小相位部分进行复倒谱域的滤波处理,再与全通部分进行合成以实现混响的去除。通过仿真实验来实现这种方法,并与另一种改进过的复倒谱域滤波的去混响方法进行比较,实验结果表明这种方法相对较好。  相似文献   

9.
张盛  杨剑鸣 《信号处理》2021,37(5):757-762
针对自组织麦克风网络,如何充分有效地利用多通道语音数据获得更好的语音分离性能是一个难题。本文介绍了一种新的多通道语音分离方法,通过引入压缩激励脊髓模块,在麦克风位置未知时,也能显式地学习潜在的通道关系,自适应地更新各个通道对应特征的权重,以增加少量的额外计算代价达到增强语音分离的效果。压缩激励脊髓模块通过将多通道的特征信息压缩到通道维度,获得全局通道依赖关系的表征,利用激活函数根据通道关系表征对瓶颈单元筛选出有价值的特征信息。瓶颈单元由脊髓网络组成,通过逐步输入的方式生成全局信息和重新配置权重,更有效地处理数据。本文在基于LibriSpeech仿真的多通道版本数据中进行实验,在评估指标SDR和SI-SDR上相比于单通道基线获得了明显的提升,并取得超越最先进的自组织麦克风多通道方法的效果。   相似文献   

10.
基于近场波束形成的麦克风阵列语音增强方法   总被引:1,自引:0,他引:1  
当麦克风阵列用于封闭环境中非手持式语音拾取时,必须面对的一个问题是声场为阵列近场的问题。该文在子带自适应波束形成方法的基础上,引进了一种基于近场波束形成的麦克风阵列语音增强方法。该方法充分利用了近场球面波的波前弯曲率,有效地衰减了混响和噪声对期望信号的影响。仿真实验结果表明,在小房间混响条件下,基于近场波束形成的麦克风阵列语音增强方法取得了较好的噪声抑制效果。  相似文献   

11.
语音产生过程包含非线性过程,传统的线性预测方法不能很好地解决这些非线性成份。局部线性预测是一种高精度的预测算法,但计算复杂度较大。为提高非线性预测的速度,提出了一种自适应递推局部线性预测算法.并设计算法的步骤,分析算法的复杂性。仿真结果表明,该算法比线性预测算法精度高,是一种有效的语音信号非线性预测方法。  相似文献   

12.
语音合成是实现人机语音通信的关键技术。文中介绍了一种基于语音信号线性预测分析的语音合成方法,以及什么是线性预测系数和如何提取线性预测系数,然后采用了重叠存储法,用预测系数合成语音。这种合成方法可以应用到语音信号的传输过程中,能减小信号的传输带宽,提高传输速率。  相似文献   

13.
语音压缩是多媒体信息压缩技术中的一个重要部分,线性预测编码技术是参数编码技术的重要内容,介绍了线性预测编码技术的概念,分析和研究了线性预测编码技术及其LPC正则方程的自相关解决。  相似文献   

14.
15.
提出了一种在自相关域上,以相关函数值为参数,利用单边自相关序列的线性预测误差去除语音中加性噪声的方法。该方法首先对含噪语音进行单边自相关处理,以语音信号的单边自相关序列替代语音信号序列,进而对该序列进行线性预测分析后,获得线性预测分析系数,并求得线性预测误差。根据误差能量与信号能量的比例关系,确定减因子u,从含噪语音中根据减因子u的大小减去预测误差,即可抑制噪声误差能量。实验表明;上述方法在低信噪比时,仍能较好地保留语音信号的频谱结构,使音质不至于下降。  相似文献   

16.
余丰  吴尘 《电子工程师》2011,37(2):56-58
目前的VoIP技术已无法满足宽带语音服务的高清语音质量和安全性,文中对这一问题,做了初步的探索和研究。在现有的压缩感知理论基础上,针对语音信号提出了一种新的稀疏域,构造了将压缩感知技术应用于语音信号压缩的基本框架。  相似文献   

17.
从线性预测HMM到一种新的语音识别的混合模型   总被引:1,自引:0,他引:1       下载免费PDF全文
欧智坚  王作英 《电子学报》2002,30(9):1313-1316
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式.  相似文献   

18.
基于atan-LMS与PLPC相结合的稳健语音识别   总被引:1,自引:0,他引:1  
刘伟  韩卫生 《电声技术》2011,35(3):42-44
将一种改进的变步长算法(atan-LMS)应用于自适应滤波器,并将之与感知线性预测倒谱技术(PLPC)相结合,简记为atan-LMS十PLPC.该方法通过优化步长和误差之间的非线性关系,使降噪效果更加显著,然后对增强语音提取感知线性预测倒谱系数(PLPC)作为特征参数.试验结果表明,基于atan-LMS+PLPC的系统...  相似文献   

19.
该文基于代数码激励线性预测(ACELP)语音编码算法提出了非均匀和部分搜索域代数码书。非均匀代数码书由代数码书的脉冲非均匀统计特性确定,部分搜索域代数码书则由代数码书矢量的周期性确定,该方法有效地弥补了低比特率情况下代数码书中脉冲数不足的缺点。在使用上述两项技术时,为保持基音的连续性,该编码器对语音段和非语音段采用了不同的基音估计方法。主观和客观的听力测试表明,当该技术应用于4kb/s 散布脉冲码激励线性预测(DP-CELP)语音编码器时,重建语音的质量得到明显改善,尤其是对女性讲话者。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号