共查询到20条相似文献,搜索用时 125 毫秒
1.
本文在分析统计信号贝叶斯模型和语音信号的时变自回归(TVAR)模型的基础上,利用蒙特卡洛滤波及平滑方法,对语音信号的TVAR模型参数进行了估计,提出了一种有效的针对非平稳加性噪声影响下的语音增强算法.该算法可以很好的跟踪非平稳信号,同时引入对反射系数的判断,保证了跟踪的稳定性.实验表明,本文方法能很好的抑制背景噪声,提高信噪比,改善语音信号的听觉质量. 相似文献
2.
3.
短波通信以其天波传播特性,在通信领域具有其他通信手段无法替代的地位。为解决短波通信中信噪比较低,噪声信号严重影响语音处理效果的问题,提出了一种基于短时倒谱速变率的平滑端点检测方法,通过检测噪声信号的倒谱特征,初步确定语音信号端点,然后加入平滑优化处理以及Holdon设计,降低由于倒谱突变造成的误判。实测信号仿真实验证明,该方法在不过多加重系统负担的前提下,取得了良好的效果。 相似文献
4.
语音端点检测中能零比方法的改进 总被引:1,自引:0,他引:1
传统的基于语音信号短时能量与短时过零率之比的单参数双门限端点检测方法对高信噪比的语音信号能实现较好的检测,而在低信噪比的情况下检测正确率却很低。本文在研究了语音信号的非线性分析方法后,提出了一种改进的端点检测方法。首先,对分帧加窗后的每一帧带噪语音信号进行经验模态分解求其短时Teager能量;然后,求每一帧的短时过零率,平滑处理之后进行归一化;最后,求出短时Teager能量与归一化短时过零率之比用于端点检测。经过仿真实验证明,本文提出的改进方法能够在低信噪比的带噪环境下实现比传统能零比方法更好的端点检测效果。 相似文献
5.
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。 相似文献
6.
本文根据语音信号在离散余弦变换(discrete cosine transform,DCT)域上的近似稀疏性,将压缩感知(compressed sensing,CS)应用于语音增强。提出了一种基于压缩感知的语音增强新算法。算法采用对语音信号具有一定鲁棒性的行阶梯矩阵,对含噪语音进行压缩观测,通过改进的正交匹配追踪OMP(orthogonal matching pursuit,OMP)算法重构语音信号,最后用低通滤波器对重构语音进行平滑滤波,实现语音增强。实验结果表明:本文所提语音增强算法在提高输出信噪比的同时,减少了重构时间,具有较强的鲁棒性。 相似文献
7.
提出了一种噪声功率谱估计算法,该算法对加权后的带噪语音进行递归平滑,可以持续更新噪声并可应用于非平稳噪声环境中。为了避免在强语音后的弱语音区域出现噪声过估计,本文提出了用于计算加权函数的投影平滑算法。本文噪声估计算法可以快速跟踪噪声的变化并且没有过估计。实验结果表明,本文噪声估计算法应用于一个语音增强系统时,取得了较小的噪声分段估计误差及较好的感知语音质量评价(PESQ)得分。 相似文献
8.
9.
介绍了一种实用的语音分离算法CoBliSS,他是一种基于二阶统计量的多通道盲反卷积算法.但是源信号自相关函数的序列长度必须足够大,而大多数语音信号不满足这一要求.但是针对非平稳的语音信号,非严格的理论分析显示二阶统计量可以用于语音分离,将CoBliSS算法与回声消除相结合,给出了ECoBliSS算法.结果表明当ECoBliSS算法用于远程会议系统时,分离出了较高质量的语音信号,而且速度也比较快. 相似文献
10.
11.
12.
基于听觉感知小波变换的电子耳蜗CIS语音信号处理 总被引:1,自引:0,他引:1
为克服以往滤波器组参数调整复杂,提出了一种听觉感知的小波变换的电子耳蜗语音处理的方法。文章在连续交替取样CIS(Confinuous Interleaved Sampling)语音信号处理方案的基础上,利用人耳听觉的临界频率与听觉感知的小波变换域的相似性,进行了电子耳蜗输出信号的重构,采用短时傅立叶变换的语谱图分析。实验结果表明:本方法获得的合成语音与原始语音在频谱包络特征上非常相似,频域特征里接近入耳的实际生理特性。 相似文献
13.
语音信号处理技术的基本概念和发展过程;用基于短时分形维数的模糊控制滤波方法,对语音信号中的噪声进行了滤波处理;提出了网络分形维数和短时分形维数的新算法,并讨论了模糊控制滤波方法中的模糊控制参数的选取问题;给出了在虚拟仪器(VI)LabVIEW 7.0软件平台上对语音信号进行仿真的结果。 相似文献
14.
一种新的自适应语音增强系统 总被引:4,自引:0,他引:4
针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量,任何原始语音信号泄漏到参考信号中,都会导致原始语音信号失真和噪声抵消性能恶化这一问题,本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号,然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模,并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时,用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明,这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。 相似文献
15.
基于频谱减法的语音去噪算法研究 总被引:1,自引:1,他引:0
语音增强技术是音频信号处理中的重要部分,频谱减法是目前在语音增强技术中最常用的方法之一。针对传统频谱减法会产生音乐噪声并无法消除音乐噪声的不足之处及高频噪声干扰比较严重的情况下频谱减法效果差的情况,采用了在频谱减法之后进行LMS滤波以降低音乐噪声对语音质量的影响和低通滤波以滤除脉冲干扰。根据仿真结果表明,改进扩展频谱减法能够有效降低音乐噪声和尖锐的高频兹兹声,从而提高信噪比,达到语音增强的目的。 相似文献
16.
Blind equalisation of a speech signal that has been passed over a linear filter can be achieved by estimating the poles of the signal and separating the stationary poles due to the filter from the time varying poles due to the speech. However, identification of the position of the stationary poles, conventionally done by pole clustering, is unreliable and slow. A new algorithm for the identification of stationary poles is presented which is more accurate and faster than clustering 相似文献
17.
在相对封闭的空间内,使用一些通讯设备时,距离声源较远的麦克风接收到的语音信号通常会被混响和噪声所污染,这些干扰信号会在很大程度上降低语音可懂度。带噪的混响语音经过去混响和消噪算法处理后,常常会残留一些音乐噪声,使得人耳听起来很不舒服。本文根据人耳对不同频带的听觉特征,引入Gammatone听觉滤波器组,提出了Gammatone滤波器修正的多级线性预测去混响算法。实验结果证明,新算法有效的解决了去混响及消噪后的残留音乐噪声问题,提高了语音的清晰度和舒适度。 相似文献
18.
We propose a new speech communication system to convert oral motion images into speech. We call this system “the image input microphone.” It provides high security and is not affected by acoustic noise because it is not necessary to input the actual utterance. This system is especially promising as a speaking-aid system for people whose vocal cords are injured. Since this is a basic investigation of media conversion from image to speech, we focus on vowels, and conduct experiments on media conversion of vowels. The vocal-tract transfer function and the source signal for driving this filter are estimated from features of the lips. These features are extracted from oral images in B learning data set, then speech is synthesized by this filter inputted with an appropriate driving signal. The performance of this system is evaluated by hearing tests of synthesized speech. The mean recognition rate for the test data set was 76.8%. We also investigate the effects of practice by iterative listening. The mean recognition rate rises from 69.4% to over 90% after four tests over four days. Consequently, we conclude the proposed system has potential as a method of nonacoustic communication 相似文献
19.