共查询到19条相似文献,搜索用时 140 毫秒
1.
2.
针对传统深度神经网络语音增强算法未区分在不同信噪比环境中去噪的侧重点,同时考虑到预测相位信息对于语音增强的重要性,提出了时频掩码优化的两阶段语音增强算法.第一阶段将带噪语音的幅度谱特征输入深度神经网络进行训练,预测得到干净语音幅度谱和噪声幅度谱;第二阶段通过信噪比信息估计增益系数,以控制残留噪声和语音失真之间的平衡;同... 相似文献
3.
基于分数阶谱相减的语音增强法 总被引:2,自引:0,他引:2
该文提出了基于分数阶谱相减的语音增强法(FSS)。该方法通过对带噪语音信号作分数阶傅里叶变换(FRFT),将得到的分数阶语噪混合谱与估计的分数阶噪声谱相减,最后利用分数阶Fourier反变换获得去噪后的语音信号。理论分析表明,所提方法存在一个最佳分数阶阶数,使得语噪混合信号能在分数阶变换域得到最好的分离,从而有效地提高了增强语音的性能。计算机仿真表明,对于混有加性白噪声的男/女声发音信号,所提方法在信噪比提高量和Itakura距离减少量两个方面都优于传统的谱相减法(SS),并且增强语音中的音乐噪声得到了明显抑制。 相似文献
4.
5.
基于多频带谱减法的抗噪声语音识别研究 总被引:1,自引:0,他引:1
为了减少在噪声环境下测试条件与训练条件不匹配导致的语音识别性能下降,提出了一种结合多频带谱减法的抗噪声语音识别系统。首先提取带噪语音的前几帧作为估计的噪声信号,将带噪语音、估计的噪声信号按频率划分M个互不相交的频带,然后根据每个频带内带噪语音与估计的噪声信号的性噪比,来确定该频带噪声的谱减参数。语音增强作为前端处理,与语音识别器级连构成抗噪声语音识别系统。通过实验仿真表明,基于多频带谱减法的抗噪声语音识别系统在不同信噪比不同类型的噪声下,识别性能明显优于基本谱减法。 相似文献
6.
7.
8.
基于信号相位差和后置滤波的语音增强方法 总被引:1,自引:0,他引:1
在复杂的声学环境中,通常噪声场特性和混响强度是未知的,这样就对麦克风阵列语音增强算法的性能提出了较高的要求.本文提出一种基于带噪语音信号相位差和后置滤波的语音增强方法.首先,将麦克风阵列接收信号分帧,利用相邻两个麦克风之间每帧带噪语音信号的相位差,构成该帧改变频率点幅度谱值的比例系数,对该帧带噪语音信号进行掩蔽增强处理,得到预处理信号;然后利用固定波束形成、独立分量分析算法和后置滤波技术对预处理信号进一步处理,从而有效地抑制了噪声.计算机仿真实验结果表明,在存在一定混响的多种噪声场中,该方法均具有较好的噪声抑制能力. 相似文献
9.
10.
11.
12.
为改善旋翼飞机空地语音通信质量,针对旋翼飞机螺旋桨造成的幅度调制(Amplitude Modulation,AM)信号复杂多频干扰以及恶劣机舱背景噪声,提出了一种通信语音时频掩膜智能增强方法,从而实现对机舱噪声与复杂干扰的有效抑制。该方法首先对原始时域语音信号进行分帧与加窗,通过短时傅里叶变换获取幅度谱与相位谱;然后将原始幅度谱作为网络输入,采用深度神经网络分析其语音信号的特征,采用长短期记忆网络挖掘语音信号的时序上下文信息,实现对语音时频掩膜的准确估计,并将其用于增强原始幅度谱以得到网络输出;最后结合原始相位谱,通过逆短时傅里叶变换获得增强后的时域语音信号。仿真与实际测试表明,该方法可有效抑制旋翼飞机环境下的干扰噪声,提高通信语音信号质量。 相似文献
13.
现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想。针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法。通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进行深层特征提取,从而充分利用语音信号的幅值信息以及相位信息。在编码端和解码端的卷积层中加入非局部模块,在提取语音序列关键特征的同时,抑制无用特征,并引入门控循环单元网络捕捉语音序列间的时序相关性信息。在ST-CMDS中文语音数据集上实验结果表明,与未处理的含噪语音相比,使用文中方法生成的增强语音质量和可懂度平均提升了61%和7.93%。 相似文献
14.
为了充分利用含噪语音特征来提高语音增强网络的性能,基于含噪语音在时间和频率两个维度上的相关性,本文结合卷积神经网络的局部特征提取能力和门控循环单元的长期依赖建模能力,设计了一种适用于语音增强的卷积门控循环网络.该网络采用卷积网络结构代替全连接网络结构来改进门控循环单元中的特征计算过程,从而能够更好地保留含噪语音特征中的时频结构信息.实验结果表明,与其它语音增强网络相比,本文网络在语音成分的保留和噪声成分的抑制上具有明显优势,增强后语音具有更好的语音质量和可懂度. 相似文献
15.
借助双耳线索编码原理,通过构建一个语音和噪声的双耳线索先验码书,本文提出一种单通道语音增强方法.首先,该算法将语音和噪声的双耳线索作为语音和噪声的先验知识,在线下被训练成为先验码书.之后,在线上通过加权码书映射(Weighted CodeBook Mapping,WCBM)算法估计纯净线索参数,最后,利用双耳线索编码原理增强含噪语音.此外,本文采用深度神经网络,即堆栈式自编码器(Stacked Auto-Encoders,SAE)代替WCBM算法估计纯净线索参数,提出了基于深度神经网络的双耳线索语音增强算法.进一步提高了增强算法的性能.客观测试结果表明,本文所提方法优于参考算法. 相似文献
16.
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。 对特征融合和特征拼接两种跳跃连接方式、基于L1和 L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。 相似文献
17.
18.
提出了一种噪声功率谱估计算法,该算法对加权后的带噪语音进行递归平滑,可以持续更新噪声并可应用于非平稳噪声环境中。为了避免在强语音后的弱语音区域出现噪声过估计,本文提出了用于计算加权函数的投影平滑算法。本文噪声估计算法可以快速跟踪噪声的变化并且没有过估计。实验结果表明,本文噪声估计算法应用于一个语音增强系统时,取得了较小的噪声分段估计误差及较好的感知语音质量评价(PESQ)得分。 相似文献