首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
多带谱相减结合感觉加权的语音增强方法研究   总被引:2,自引:0,他引:2  
语音增强技术是解决噪声污染的一项强有力的预处理技术,也是语音信号处理的一个热门课题.文章提出了一种多带谱相减与感觉加权相结合的语音增强方法.该方法首先对带噪语音进行多带谱相减,然后根据人的听觉掩蔽特性,对多带谱相减后的信号进行感觉加权,以便进一步降低背景噪声.仿真结果表明,该方法在较好地抑制背景噪声和残留音乐噪声的同时,保持了较好的语音可懂度.  相似文献   

2.
本文提出新的语音增强方法。这种新方法先将带噪信号进行离散余弦变换,得到带噪语音信号的DCT系数,并提取这些DCT系数的参数作为神经网络的输入来估计阈值,从而构造阈值函数对变换后的系数进行处理,再进行离散余弦反变换最终达到去噪的目的。本文实验中的噪声采用加性高斯白噪声,仿真实验结果表明新方法具有良好的语音增强效果,特别是在低信噪比情况下,效果更好。  相似文献   

3.
针对谱减法去混响中出现的音乐噪声问题,研究了一种基于频率归一化的掩蔽后处理方法。首先利用谱减法对混响信号去除混响,其次对混响信号与去混响信号进行频率归一化,然后在频域将去混响信号和混响信号对应相减,据此计算出掩蔽因子,最后运用掩蔽因子对去混响信号进行处理来减少音乐噪声。仿真实验中分别利用语谱图和语音质量感知评价进行了评估,语谱图表明后处理语音信号中音乐噪声明显减少,语音质量感知评价表明采用后处理方法提高了语音信号0.55的评分。  相似文献   

4.
针对短波语音信噪比低、噪声复杂的特点,本文结合最佳调整对数谱幅度(OM-LSA)语音估计、改进型最小控制递归平均(IMCRA)噪声估计和谱熵语音激活检测(VAD)硬判决,提出了一种有效抑制短波通信噪声的语音增强算法。实验结果表明,本算法不仅能有效抑制短波噪声对话音的干扰,而且处理后的语音失真度小,语音自然度较高,避免了残留音乐噪声。  相似文献   

5.
针对在低信噪比环境下传统语音增强方法适应性差和增强效果不理想的问题,提出一种基于Wasserstein散度的深度生成对抗网络(Wasserstein Divergence Deep Generative Adversarial Network)的语音增强方法。该方法以5个生成器和1个判别器为基础组成深度生成对抗网络,利用5个生成器进行5次增强处理,有效提高对抗网络在低信噪比条件下的增强效果,使用Wasserstein散度优化网络训练,改善传统GAN网络训练过程中存在的训练不稳定等问题,提高深度生成对抗网络训练的稳定性。在低信噪比环境下该方法相比于传统语音增强方法噪声适应性和增强效果都有明显提升。实验结果表明,与原始带噪语音相比,增强语音的分段信噪比平均提高6.1dB,语音质量感知评估测度和短时客观可懂度分别平均提升28.9%和10.6%。  相似文献   

6.
杨诗童  杨飞 《电子测量技术》2023,46(17):118-124
由于声学环境中噪声的复杂性和不确定性,传统的多通道语音增强算法对于噪声的抑制效果不足,从而导致了较差的听觉体验。针对这一问题,提出了一种改进TF GSC和改进后置滤波语音增强算法。算法使用最大似然法得到目标语音信号和噪声信号的功率谱密度,然后使用信号功率谱密度比值得到的变步长归一化最小均方算法来改进TF GSC。还提出了联合信号功率谱密度比值和先验信噪比估计语音存在概率的改进最优修正对数幅度谱估计器。不同信噪比环境下的仿真实验表明,本文提出的算法可以有效地滤除相干噪声和非相干噪声,与其他算法相比,增强后的语音信号具有更高的信噪比和语音质量。  相似文献   

7.
为进一步提高智能电网调度语音识别的准确率,本文将深度学习技术引入了电力调度语音识别领域,提出了基于深度神经网络(deep neural network,DNN)的电力调度语音识别技术。针对电力调度专用术语以及某区域电网习惯调度用语,建立了电力调度语音识别基础语料库。通过应用深度神经网络-隐马尔可夫模型(deep neural network-hidden markov model,DNN-HMM)进行声学模型训练,并对电力调度语音材料制作,语音模型训练过程、端点检测、与D5000系统交互以及语音转文字的整套流程进行了论述。实践结果表明,采用DNN-HMM的电力调度语音识别性能要显著优于传统语音识别框架,即高斯混合-隐马尔可夫模型(gaussian mixture model-hidden markov model,GMM-HMM),采用所提方法进行电力调度语音识别准确率达94.63%。基于所提方法开发的电力调度语音识别系统在某区域电网调控中心的应用实例表明了所提方法的可行性与优良性。  相似文献   

8.
为同时在高SNR和低SNR条件下获得较好的语音质量,提出了一种耦合MMSE和WEDM幅度谱估计的语音增强方法。此方法利用Sigmoid映射函数将后验SNR映射到[0,1]之间。然后,根据此映射函数,提出一种自适应的谱恢复增益函数计算方法。在高SNR条件下,为避免语音,所提方法采用较大的映射函数值,从而使MMSE谱估计增益函数为谱恢复增益函数。反之,在低SNR条件下,为有效抑制含噪语音中的噪声,所提方法使用较小的映射函数值,从而选择WEDM谱估计增益函数为谱恢复增益函数。实验结果表明,所提算法性能在客观性能测试方面要优于参考算法。  相似文献   

9.
针对传统的语音增强网络对未知噪声增强效果不理想的问题,本文从语谱图增强,网络结构,特征融合机制三方面提出改进方法。首先为了提取语谱图深层特征信息,使用VGG19结构来代替UNet结构中编码器部分,同时在解码器部分加入残差网络以加深网络深度,防止训练退化;其次,为了更好地结合语谱图中特征信息,在UNet结构跳跃连接部分加入自适应特征融合机制来融合深浅层特征。此外,为增强说话人信息,通过直方图均衡算法对语谱图进行特征优化,得到直方图均衡化增强后的语谱图。在不同的噪声环境中,本文所提方法在质量和可理解性度量方面评分都优于其他增强方法。  相似文献   

10.
康维 《电测与仪表》2016,53(10):8-15
针对谐波分析中加窗FFT计算存在运算量大的问题,对常用窗函数进行比较,利用莱夫-文森特(RifeVincent,RV)窗优越的频谱特性,提出一种基于4项RV(I)窗多谱线插值FFT改进算法。通过分析加窗信号傅里叶变换的频域表达式,利用窗函数主瓣内相邻谱线间的相位特性,以及谐波频点附近的最大值谱线、次大值谱线和较大值谱线确定频率谱线的准确位置,改进了修正谐波幅值、频率偏差的计算方法,满足谐波分析准确度要求的同时,大幅降低运算量,提高谐波分析的实时性。仿真结果表明,提出的谐波分析方法能有效克服频率波动的影响,提高谐波测量的准确度,且能有效抑制白噪声的影响。  相似文献   

11.
为提高目前基于掩蔽与基于频谱映射的语音增强方法性能上界以及复杂环境下的泛化能力,提出了一种在联合复频谱 与复掩蔽学习框架下的协作式单通道语音增强方法。 该方法采用编码器-双分支解码器结构,在编解码部分设计了一种交互协 作学习单元(ICU)来监督交互语音信息流,并提供有效的潜在特征空间;中间层则是设计出一种多尺度融合 Transformer,以少 量参数在空间-通道维度上多尺度地提取细节信息后融合输出,同时对语音子频带与全频带信息建模。 在大、小数据集与 115 种噪声环境下进行实验,结果表明该方法仅以 0. 57 M 的参数量,取得比大部分先进且相关方法更优的主、客观指标,具有良好 的鲁棒性与有效性。  相似文献   

12.
In this paper, the minimum mean‐square error (MMSE) β‐order estimator for multichannel speech enhancement is proposed. The estimator is an extension of the single‐channel MMSE β‐order and multichannel MMSE short‐time spectral amplitude estimators using Rayleigh and Gaussian distributions for the statistical models under the assumption of a diffuse noise field where the noise is estimated independently across each of the microphones. Experiments are performed to evaluate the new estimator against the baseline single‐channel and multichannel estimators using various values of the β parameter and number of microphones along with different levels of noises as a function of the input signal‐to‐noise ratio. By the utilization of additional microphones, the multichannel MMSE β‐order estimator achieves performance gains in noise reduction, speech distortion, and speech quality as measured by the segmental signal‐to‐noise ratio, log‐likelihood ratio, and perceptual evaluation of speech quality objective metrics. Copyright © 2015 John Wiley & Sons, Ltd.  相似文献   

13.
在语音识别系统中,端点检测是极其重要的一个环节。为了提高在各种实际噪声环境下语音端点检测的正确率,提出一种基于小波分析与神经网络的语音端点检测算法来提高语音端点检测率。利用小波分析提取语音信号的特征量,然后将特征向量作为BP神经网络输入进行学习,采用粒子群算法优化BP神经网络参数,建立语音端检测模型,并进行仿真实验,结果表明WA-IMPSO-BP提高了语音端点检测率,有效降低了虚检率和漏检率,是一种检测率高,抗噪性能强的语音检测算法。  相似文献   

14.
随着大量分布式能源的接入,配电系统的运行与控制方式愈加复杂。针对配电网状态估计方法面临分布式电源波动数据辨识困难、估计精度低、鲁棒性与估计时效性差等问题,提出一种基于集成深度神经网络的配电网分布式状态估计方法。首先,利用量测数据相关性检验的数据辨识技术识别不良数据和新能源波动数据。在此基础上,利用时域卷积网络(temporal convolutional network, TCN)-双向长短期记忆网络(bidirectional long short term memory, BILSTM)对不良数据进行修正。然后,建立集成深度神经网络(deep neural network, DNN)状态估计模型,采用最大相关-最小冗余(maximum relevance-minimum redundancy, MRMR)的方法优化训练样本,从而提高状态估计的精度和鲁棒性。最后,建立分布式集成深度神经网络模型,弥补了集中式状态估计速度慢的不足,从而提高状态估计效率。基于IEEE123配电网的算例分析表明,所提方法能更准确地辨识分布式电源波动数据和不良数据,同时提高状态估计的精度和效率,且具有较高的鲁...  相似文献   

15.
针对液体表面特征少,区分度低,机器视觉难以有效识别检测的问题,通过使用两束不同波长的激光光源同时照射液体来提高不同液体之间的区分度,设计了数据集自动采集装置为模型训练提供了大量有效的样本,并构建了基于EfficientNetV2深度神经网络的视觉识别模型,模型引入cosine学习率衰减,调节获得最佳超参数后,形成最优方式实现高效训练,进一步提升了预测精度,结果表明视觉检测系统能够获得100%的测试准确率,成功解决了液体视觉检测中特征少的难题。  相似文献   

16.
针对网络入侵检测中攻击样本和流量特征不足的问题,提出一种基于自监督特征增强的CNN-BiLSTM网络入侵检测方法,实现在流量数据中检测异常网络流量的目标。通过分析流量特征数据分布差异,采用IQR异常值处理方法进行数据预处理,使用自编码器对攻击样本进行数据增强,构建CNN-BiLSTM神经网络和自编码器组成半自监督模型,分别提取高维流量特征和自监督特征,将组合特征作为最终特征输入到分类模型中进行预测分类,实现网络入侵检测。实验结果表明,与其他入侵检测方法相比,所提方法在准确率和F1分数上分别达到了85.7%和85.1%,能够有效提高网络入侵的检测精度以及对未知攻击的检测能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号