共查询到20条相似文献,搜索用时 0 毫秒
1.
语音增强是一种试图从噪声中分离出语音的技术,目的是提高语音的质量和可懂度。在过去的几十年里,人们提出了多种类型的语音增强方法,但这些方法在非平稳噪声环境中的表现还未达到最佳程度,因为他们没有充分利用语音和噪声的先验信息。近年来,随着深度学习的发展,深度神经网络已成为当下实现语音增强的主流方法,在改善语音质量和提升可懂度方面发挥了积极作用。本文从深度神经网络的结构出发,回顾了基于深度学习的单通道语音增强方法。首先,介绍了语音增强的背景;其次,详细描述了四种不同类型神经网络实现语音增强的方法;最后,给出了未来语音增强方法的建议和本文的结论。 相似文献
2.
针对现有深度神经网络语音增强方法对带噪语音的去噪能力有限、语音质量提升不高的问题,提出了一种基于奇异谱分析的深度神经网络语音增强方法。通过引入奇异谱分析算法对带噪语音进行预处理,以初步分离得到语音信号与噪声。接着将语音信号与噪声用于深度神经网络模型得训练,以得到性能更优的网络模型,从而使得本文方法具有更好的性能。最后在重建干净语音的环节中,同时使用神经网络估计得到的对数功率谱和带噪语音的对数功率谱,并加入了权重系数,使得本文提出的方法可以适应不同信噪比的情形,有效的去除背景噪声,降低语音信号的失真。本文通过仿真实验验证了该方法的有效性和鲁棒性。 相似文献
3.
4.
5.
语音增强的目的是从带有噪声的语音中分离出纯净语音,实现语音的质量和可懂度的提高。近年来,采用有监督学习的深度神经网络已经成为了语音增强的主流方法。卷积循环网络是一种新型的神经网络结构,包含编码层、中间层、解码层三个主要模块,其已经在语音增强任务中取得了较好的效果。时频注意力机制是一个由数个相连的卷积层通过跳跃连接构成的简单网络模块,在训练过程中可以计算语音幅度谱特征图的非邻域相关性,从而更加有利于网络关注到语音的谐波特性。本文将时频注意力机制引入卷积循环网络的编码层和解码层中,实验结果表明,在不同信噪比条件下,该方法相比基线卷积循环网络能够进一步提高语音质量和可懂度,且增强后的语音信号可以保留更多的语谱谐波信息,实现更低程度的语音失真。 相似文献
6.
7.
本文研究了一种基于深度置信网络的语音增强算法。选取在噪声环境下传统语音增强算法中较好的LOGMMSE与OM-LSA算法和基于深度置信网络的语音增强算法进行了分析比较,结果证明深度置信网络的语音增强算法在三种算法中体现出了卓越的性能,尤其对增强后的语音质量的提升远远超过前两种算法。 相似文献
8.
步兵战车强噪声背景下由于强背景噪声的存在,既影响了口令识别的正确率,又降低了指挥所后台监听的清晰度,为了提高语音质量,本文对口令数据进行增强处理.为此,本文提出了一种基于升降编解码全卷积神经网络(Increase De-crease Encoder Decode Convolution Neural Network,I... 相似文献
9.
在语音增强技术领域,双麦克风语音增强技术具有尺寸小、功耗低的优势,因此得到了越来越多的应用。传统的双麦克风语音增强技术一般使用全向麦克风进行信号采集。矢量语音传感器可以采集声矢量信息,其“8”字形指向性使其天然具有抑制环境噪声的能力。将基于相干函数的双麦克风语音增强算法与矢量语音传感器相结合,提出一种基于矢量语音传感器的双麦克风语音增强算法,对其指向性进行仿真分析,并在消声室进行实测验证。结果表明,与相同阵列形式下的全向麦克风双麦阵列相比,矢量语音传感器双麦阵列具有更好的指向性和语音增强效果。 相似文献
10.
根据传统的基于短时谱的维纳滤波算法,提出了一种改进方法,能有效地对噪声估计环节引入的偏差做修正,提高了整个语音增强系统的抑噪功效。运用MATLAB进行试验仿真,并与传统维纳滤波算法相比较,结果表明该算法能十分有效地滤除噪声,增强语音,同时对有效语音信号带来的失真也非常小,使语音信号的清晰度与可懂度同时得到了提高。 相似文献
11.
基于Gamma语音模型的语音增强算法 总被引:2,自引:0,他引:2
提出了一种新的基于Gamma语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Gamma和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了基于Gamma语音模型的改进最小统计量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,该算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。 相似文献
12.
目前对于语音技术的研究,已经取得了一定的进展。在语音的实际运用中,100%的纯信号是不存在的。不管是何种语音信号,都难免受到其他声音的干扰和影响。为了解决这种问题,尽可能避免语音信号被干扰,就要采用语音增强技术,将原始信号的功率增强放大,用以抵抗噪音等的干扰,保证语音信号顺利传输。目前普遍采用的语音增强技术是使用自适应滤波器的对抗抵消功能消除噪音的影响,并运用延时技术,实现语音增强的目的。这种技术可以清除混杂其中的其他信号,获得纯度较高的语音信号。本文主要对语音增强技术做了简单的研究,并探讨了如何提高语音传输的质量。 相似文献
13.
介绍了几种传声器阵列语音增强算法,包括固定波束形成、自适应波束形成、传声器阵后维纳滤波,并对各算法的性能和特点进行了分析。同时,对近几年基于传声器阵的语音增强技术的发展趋势进行了简单介绍。 相似文献
14.
目前对于语音技术的研究,已经取得了一定的进展.在语音的实际运用中,100%的纯信号是不存在的.不管是何种语音信号,都难免受到其他声音的干扰和影响.为了解决这种问题,尽可能避免语音信号被干扰,就要采用语音增强技术,将原始信号的功率增强放大,用以抵抗噪音等的干扰,保证语音信号顺利传输.目前普遍采用的语音增强技术是使用自适应滤波器的对抗抵消功能消除噪音的影响,并运用延时技术,实现语音增强的目的.这种技术可以清除混杂其中的其他信号,获得纯度较高的语音信号.本文主要对语音增强技术做了简单的研究,并探讨了如何提高语音传输的质量. 相似文献
15.
针对智能机器人语音校准结果不精准的问题,研究基于深度学习的智能机器人语音自动校准系统。设计语音自动校准引擎A/D电路,通过模拟信号发射范围采集与控制电路原始音频信息,利用紧凑型嵌入式音频接收器接收音频信息。整理与识别音频信息内容,获取语句文本样本集。使用深度学习的正弦和余弦函数编码处理方式构建校正模型的输入部分,通过深度学习的前馈神经网络训练输入样本,完成校正模型输出部分的构建。将训练后的样本输入到校正模型中,得到校正后的文本,实现智能机器人语音自动校准。由实验结果可知,该系统两种指令下的振幅波动范围分别为9~22 dB和7~21 dB,与实际振幅波动情况一致,具有精准校准结果。 相似文献
16.
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法. 相似文献
17.
在实际应用中,待分析的语音信号一般是被噪声污染的语音,很大程度上影响了语音处理系统的性能。为此,需要我们对带噪语音进行语音增强处理,抑制噪声,恢复纯净语音。本文就谱减法对带噪语音进行处理,并利用matlab行仿真,验证了谱减法的语音增强的效果。 相似文献
18.
19.
近年来,随着神经网络的应用,语音增强效果显著提升。但对关联性较强的长序列语音数据,单一的网络结构受到自身性能的限制可能无法继续提升增强效果。为了进一步提升神经网络对语音增强的效果,本文将一种被称为双路径循环神经网络(dual-path recurrent neural network,DPRNN)的复合网络结构应用在语音增强任务中。该复合网络结构由卷积神经网络(convolution neural network,CNN)和长短时记忆神经网络(Long short-term memory,LSTM)组成,网络的核心是两个LSTM组成的双路径循环神经网络块(DPRNN Block)。DPRNN将长序列语音数据分割为重叠帧数据块,利用DPRNN Block对这些数据块执行块内计算和块间计算,以此实现数据的局部和全局建模。实验结果表明,相比于单一网络结构,DPRNN在训练噪声和非训练噪声条件下均取得最好结果。 相似文献
20.
语音增强目的是从带噪语音中尽可能纯净的原始语音,即消除含噪语音信号中的噪声成份,提高输入信号的信噪比.在实际应用环境中,语音都会不同程度受到噪声的干扰,噪声会影响语音质量,严重的情况下将语音完全淹没到噪声中,无法分辨.本文将读入的语音信号加入正态随机噪声,然后对含噪声的语音信号进行小波分解,估计噪声的方差,然后获取去噪的阈值并对小波分解的高频系数进行阈值量化,得到去噪后的语音信号.仿真证明此方法具有很好的增强效果. 相似文献