首页 | 本学科首页   官方微博 | 高级检索  
 共查询到18条相似文献,搜索用时 125 毫秒
王瑶  曾庆宁  龙超  谢先明  毛维 《声学技术》2018,37(5):457-464
针对语音端点检测在低信噪比环境下普遍存在检测性能急剧下降的问题,提出一种将调制域(时间-频率域)谱减法和自相关函数相结合的语音端点检测算法。该算法首先利用调制域谱减法较好的消噪能力来提高含噪语音的信噪比;然后根据语音和噪声的自相关函数的主峰最大值和次大值之比差异较大的特性,结合基于对数能量和自相关函数的端点检测方法对消噪后的语音进行端点检测。实验结果表明,该算法在低信噪比的环境下能取得较好的端点检测效果,并具有较好的稳健性。  相似文献   

为了抑制谱减法语音增强时引入的“音乐噪声”,采用基于后验信噪比频域迭代算法的语音增强方法。首先,当后验信噪比大于20dB时,对含噪语音采用谱过减法;当后验信噪比小于20dB时,对含噪语音谱线进行衰减处理。为了进一步抑制音乐噪声,对增强语音信号进行多次频域迭代降噪处理。对实验室环境录制的不同输入信噪比条件下的含噪语音信号进行处理,与传统谱减法相比,增强语音信号的信噪比有较大的提高,并且音乐噪声得到很大程度的抑制。  相似文献   

听觉掩蔽效应语音增强的改进算法   总被引:2,自引:1,他引:1  
于凤芹  阚仁根 《声学技术》2008,27(5):712-716
含噪信号利用掩蔽效应去噪后,噪声估计的误差导致语音失真。在利用听觉阈值计算谱减系数时提出了一种改进的计算方法,通过增加修改参数来抑制语音的过分衰减,减少了语音失真,然后基于MMSE准则对增强的语音谱再进行平滑处理,进一步抑制音乐噪声。实验表明该算法在不影响语音失真的基础上,提高了信噪比,消除了音-/乐噪声,主观测听的语音音质明显提高。  相似文献   

许铭  王冬霞  周城旭  张伟 《声学技术》2019,38(5):560-567
针对单通道非负矩阵分解语音增强算法忽略相位信息的问题,提出了一种改进的Kullback-Leibler复非负矩阵分解的语音增强算法。该算法考虑到传统非负矩阵分解算法在复频域中增强语音时目标函数的影响,构建了一种适用于复频域的Kullback-Leibler散度下的目标函数,同时采用频谱一致性约束相位谱补偿算法,使其重构出的语音数据相位谱得到进一步的调制。实验结果表明,对于不同的非平稳噪声,所提出的算法在不同信噪比下均取得了较好的语音增强效果,尤其在低信噪比条件下(0 dB以下)语音增强效果较为明显,性能评估指标的增量较高,较好地克服了由传统相位谱补偿算法造成的信源失真率较低的缺点,进一步减少失真,抑制背景噪声,实现语音增强。  相似文献   

杜胜超 《硅谷》2010,(9):126-126,25
对语音信号进行预处理,包括预滤波、采样、量化、分帧、加窗以及端点检测等内容:采用能够反映人对语音信号的感知特性的Mel频率倒谱系数作为语音信号的特征参数:应用目前在语音识别中广泛应用的技术——动态时间规整技术作为识别算法。测试结果表明,利用该技术进行语音识别,准确率可达到95%以上,识别效果良好。  相似文献   

利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。但是在信噪比较小的环境下,这两种方法便失去了作用。为了能在噪声环境下准确地检测出语音信号的端点,根据对含噪语音在时频域中的研究,提出了一种基于Matching pursuits时频分解算法的语音端点检测方法。该方法使用Matching pursuits算法对含噪信号进行分解,然后再对信号进行魏格纳变换,可以完全去除信号的魏格纳交叉干扰项,使得语音信号和噪声信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点再进行端点检测,实验结果表明,该方法能在信噪比较低的情况下,准确地检测出语音信号的端点。  相似文献   

针对传统最小均方误差谱幅度估计(MMSE—STSA.minimum mean-square error-short time spectral amplitude)语音增强算法无法有效的跟踪非平稳噪声变化的问题,对一种改进的MMSE-STSA语音增强算法进行了研究和仿真。该算法对背景噪声的估计利用加权噪声估计方法:采用一个非线性函数根据带噪语音信噪比(SNR.signal—to-noise ratio)的变化计算得到相应的加权因子并作用于带噪语音信号,对加权的带噪语音求平均得到估计的背景噪声。算法中的谱增益修正,还可以抑制低信噪比时的残留噪声以及避免对带噪语音的过抵消。实验结果表明,该方法能很好的跟踪非平稳噪声的变化,不仅在增强性能上有很好的效果,同时降低了语音的失真。  相似文献   

吕钊  吴小培  李密 《振动与冲击》2011,30(2):238-242
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,文章提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,本文所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明本文所提算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。  相似文献   

单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。  相似文献   

飞机舱音背景声下的鲁棒语音端点检测   总被引:1,自引:1,他引:0  
有效提取飞机舱音背景声下的语音信息对飞机失事原因调查十分重要.提出了基于统计模型的语音端点检测方法.利用高斯混合模型逐帧计算语音/非语音状态的输出概率,利用后向估计方法和平行非线性卡尔曼滤波器估计非平稳噪声帧.最后,通过似然比门限值的计算区分语音和非语音段.与目前典型的语音端点检测算法的对比实验表明,在飞机舱音背景声下,该算法具有较好的准确性、自适应性和鲁棒性.  相似文献   

王科攀  高勇 《声学技术》2010,29(6):615-619
针对信号相位匹配算法能够在信号估计中准确提取信号频率成分的优点,将三子阵信号相位匹配算法应用于提取强背景噪声中的语音信号,同时提出了基于平均段内功率谱密度距离的语音质量客观评价方法,将主观平均意见分(MOS)、信噪比和平均分段功率谱密度距离作为指标,分别对三子阵信号相位匹配法、谱减法和最小均方误差估计法这三种算法的处理结果进行客观评价并对算法的降噪性能做了对比。仿真结果表明,三子阵相位匹配算法能够达到强背景噪声环境下语音降噪的目的;同时基于平均段内功率谱密度距离的语音质量客观评价结果与主观评价结果相符合,该评价方法具有一定的可行性。  相似文献   

The measurement of signal-to-noise power ratio (SNR) is of fundamental importance in many areas of electrical engineering, such as communications, signal processing, tests and measurements, circuits and systems, etc. In this paper, we propose two algorithms for estimating the signal-to-noise ratio of a noisy sinewave from discrete-time data obtained by sampling the input signal. One algorithm is based on the estimation of the four parameters of the input sinewave. The second algorithm is based on estimating the average noise power by averaging the squared magnitude of the FFT bins attributed to the noise. Both methods show excellent performance. Simulation results indicate that the four-parameter method requires the input SNR to be at least 10 dB and the input signal frequency not exceeding one-third of the sampling frequency. On the other hand, the second approach, the spectrum averaging method, shows a remarkable robustness over a very wide range of normalized frequencies (with respect to the Nyquist frequency) and SNRs (well over 100 dB). This spectrum averaging method should prove to be very useful in a wide range of applications  相似文献   

Additive noise effect in digital phase detection   总被引:2,自引:0,他引:2  
Surrel Y 《Applied optics》1997,36(1):271-276
The characteristic polynomials associated with the algorithms used in digital phase detection are used to investigate the effects of additive noise on phase measurements. First, it is shown that a loss factor eta can be associated with any algorithm. This parameter describes the influence of the algorithm on the global signal-to-noise ratio (SNR). Second, the variance of the phase error is shown to depend mainly on the global SNR. The amplitude of a modulation of this variance at twice the signal frequency depends on a single parameter beta. The material presented here extends previously published results, and as many as 19 algorithms are analyzed.  相似文献   

In ultrasonic flaw detection in large grained materials, backscattered grain noise often masks the flaw signal. To enhance the flaw visibility, a frequency diverse statistical filtering technique known as split-spectrum processing has been developed. This technique splits the received wideband signal into an ensemble of narrowband signals exhibiting different signal-to-noise ratios (SNR). Using a minimization algorithm, SNR enhancement can be obtained at the output. The nonlinear properties of the frequency diverse statistic filter are characterized based on the spectral histogram, which is the statistical distribution of the spectral windows selected by the minimization algorithm. The theoretical analysis indicates that the spectral histogram is similar in nature to the Wiener filter transfer function. Therefore, the optimal filter frequency region can be determined adaptively based on the spectral histogram without prior knowledge of the signal and noise spectra.  相似文献   

Detector noise limits the performance of signal-processing-in-the-element detectors. For detectors to be optimized, an expression for the signal and noise must be found. The results of the eigenmode solution to the charge transport problem are used to derive the power spectral density of the noise in analytic form. This result is then coordinated with a similarly obtained modulation transfer function to yield a frequency-dependent signal-to-noise ratio (SNR). The SNR is used to reveal performance trends over several ranges of detector parameters. The most important result is that the contact boundary velocity strongly controls the SNR. The optimum SNR condition occurs when the contacts are not perfectly ohmic but exhibit a partially blocking behavior.  相似文献   

A liquid-crystal variable retarder inserted into a differential-interference contrast video microscope switches image highlights into shadows and vice versa in alternate frames. Synchronous computation and display of the difference between alternate frames yield a stream of images with doubled contrast and reduced fixed-position noise because of the automatic background subtraction. The measured signal-to-noise ratio (SNR) peaks when the modulation +/- Gamma of the retarder equals the phase shift delta of the sample. A Jones calculus model of the central ray in the polarization-modulated differential-interference contrast microscope yields SNR = (sin Gamma sin delta)/((1 - cos Gamma cos delta)N), where N is the rms time-dependent photon noise. This expression fits the experiments closely for 1.8 degrees < or = Gamma < or = 115 degrees.  相似文献   

针对噪声环境下语音识别率急剧下降的问题,提出了一种基于语音时频域稀疏性原理的改进最小方差无畸变响应波束形成与改进维纳滤波结合的算法。该算法首先利用麦克风阵列语音信号的空间信息,通过基于时频掩蔽的改进最小方差无畸变响应波束形成器,增强目标声源方向的语音信号,抑制其他方向噪声的干扰,然后再使用改进的维纳滤波器去除残留噪声并提高语音可懂度,对增强后的语音信号提取梅尔频率倒谱系数作为特征参数,使用隐马尔可夫模型搭建语音识别系统。实验结果表明,该方法能够有效提高低信噪比环境下的语音识别率,具有较好的鲁棒性。  相似文献   

王志强  李钢虎  魏鑫 《声学技术》2011,30(3):280-283
基于声纳员的感受被动声纳可以认为是一个发声体,这个发声体可以表示为激励噪声源与发声体冲激响应的卷积。在这种情况下,使用倒谱和复倒谱的形式分析被动声纳目标噪声的时域特征,得到的目标特征不够明显,因此提出了利用指数倒谱和指数复倒谱的频谱特性来提取目标噪声的特征,进行分类识别。设计了BP神经网络分类器,利用实测数据对三类目标进行分类。分析比较了两种方法的分类结果,验证了基于倒谱和复倒谱的指数运算的被动声纳目标特征提取方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号