首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为提高语音识别系统在复杂声学场景下的识别率,出现了以单通道语音增强(Monaural Speech Enhancement)技术作为前端处理的鲁棒语音识别系统.尽管现有的单通道语音增强技术能够提高混响干扰下的识别率,却未能显著提升宽带非平稳噪声干扰下的系统识别率.为此,本文提出基于听觉掩蔽生成对抗网络的单通道增强方法,...  相似文献   

2.
黄国捷  金慧  俞一彪 《信号处理》2018,34(10):1246-1251
提出一种增强变分自编码器进行非平行语料语音转换的新方法。源语音首先经过编码网络生成一个服从高斯分布的语音编码,解码网络将该语音编码重构为指定的目标语音,最后通过增强网络优化生成的目标语音。增强网络的一个输入对应一个输出的,这使得整体转换系统有较好的去噪能力。此外,本文还引入了循环训练方法以改善转换语音的目标倾向性。实验结果显示,与基准语音转换系统相比,本文提出的增强变分自编码器语音转换系统在跨性别语音转换上的客观评价指标谱失真上下降10.3%,在主观评价指标相似度与清晰度方面同样有所改善。这一结果表明,本文提出的方法能够使转换语音具有良好目标倾向性,同时有较好的语音转换质量。   相似文献   

3.
如何提高对未知噪声类型的泛化能力是有监督语音增强方法中亟待解决的重要问题,通过对大量不同类型噪声进行建模,深度神经网络成为了解决该问题的有效手段.为了进一步提高基于深度神经网络的语音增强方法的泛化能力,本文基于生成式对抗网络(Generative Adversarial Networks,GAN)设计了能够由真实噪声数据生成新的噪声类型的NoiseGAN;通过在训练集中增加生成噪声类型,提高训练集噪声类型的多样性,从而达到提高语音增强模型泛化能力的目的.不同结构的网络下的语音增强实验结果表明,本文提出的NoiseGAN能够生成新的噪声类型,具备提高训练集噪声类型多样性的能力,有效提高了语音增强模型在未知噪声类型下的泛化能力.  相似文献   

4.
张玥  张雄伟  孙蒙 《信号处理》2022,38(10):2134-2143
近年来,基于神经网络的方法大量应用于骨导语音增强中。然而,由于骨导数据集样本较少,骨导语音高频部分缺失,不同说话人高频部分失真程度不同,神经网络难以有效学习骨导语音的频谱特征。因此,现有骨导语音增强模型对于未知说话人骨导语音数据集增强效果不佳、鲁棒性不强。为充分利用骨导语音的时频信息,引导模型关注骨导语音的低频部分特征,提出一种基于时频注意力机制和U-Net的骨导语音增强方法。该方法将时频注意力机制引入U-Net结构中,首先根据骨导语音时间、频率方向特征信息的重要程度自动为其分配权重,而后以加权后的骨导语音谱作为输入,对应的气导语音谱作为目标进入U-Net结构训练,最后利用训练完成的增强模型重构骨导语音全频带的语音。仿真实验与可视化分析结果表明,对比基线U-Net结构与其他注意力机制,该方法对于未知说话人骨导语音数据集能够取得更高的PESQ和STOI客观评价指标,增强语音更加清晰。  相似文献   

5.
杨雪 《江苏通信技术》2023,(2):97-100+107
针对深度学习中训练样本数量少,难以满足深度学习需求的问题,提出一种基于深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)的数据增强方法,将深度学习运用于数据增强,利用卷积神经网络(Convolutional Neural Network,CNN)构建生成器与鉴别器网络,引入高斯误差线性单元(Gaussian Error Linear Unit,GELU)作为激活函数。将名人头像数据集(Large-scale CelebFaces Attributes,Celeb A)作为训练样本进行训练。试验结果表明,该网络的鉴别器损失值快速收敛于0附近,生成器损失值快速收敛于3附近,收敛速度较快。网络能够根据学习到的样本数据分布,生成逼真的样本数据,该方法能够有效解决样本数量稀少的问题,实现数据增强。  相似文献   

6.
在语音增强技术领域,双麦克风语音增强技术具有尺寸小、功耗低的优势,因此得到了越来越多的应用。传统的双麦克风语音增强技术一般使用全向麦克风进行信号采集。矢量语音传感器可以采集声矢量信息,其“8”字形指向性使其天然具有抑制环境噪声的能力。将基于相干函数的双麦克风语音增强算法与矢量语音传感器相结合,提出一种基于矢量语音传感器的双麦克风语音增强算法,对其指向性进行仿真分析,并在消声室进行实测验证。结果表明,与相同阵列形式下的全向麦克风双麦阵列相比,矢量语音传感器双麦阵列具有更好的指向性和语音增强效果。  相似文献   

7.
基于Gamma语音模型的语音增强算法   总被引:2,自引:0,他引:2  
邹霞  陈亮  张雄伟 《通信学报》2006,27(10):118-123
提出了一种新的基于Gamma语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Gamma和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了基于Gamma语音模型的改进最小统计量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,该算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。  相似文献   

8.
王涛  全海燕 《信号处理》2020,36(6):1013-1019
基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相位信息。同时,利用对抗机制,使生成模型和判别模型分别训练目标语音和干扰语音的特征,提高了语音分离的有效性。实验中,采用Aishell数据集进行对比测试。结果表明,本文所提方法在三种信噪比条件下都有良好的分离效果,能更好地恢复出目标语音中的高频频段信息。  相似文献   

9.
邹领  曾庆宁 《电声技术》2007,31(12):47-50
介绍了几种传声器阵列语音增强算法,包括固定波束形成、自适应波束形成、传声器阵后维纳滤波,并对各算法的性能和特点进行了分析。同时,对近几年基于传声器阵的语音增强技术的发展趋势进行了简单介绍。  相似文献   

10.
何文龙  高长丰  黎塔  刘建 《信号处理》2021,37(5):893-901
为了进一步利用源文本数据来提高语音翻译的性能,本文提出了一种基于生成对抗网络的端到端语音翻译算法.通过加入判别网络来判断语音特征序列和文本特征序列的真伪,从而引导生成模型来学习文本真实序列的分布,以使语音序列特征分布更加逼近文本特征序列的分布.引入了Wasserstein GAN (WGAN)来计算语音特征序列和文本特...  相似文献   

11.
马璐 《红外技术》2022,44(4):410-420
成像系统实时采集的低光照环境图像具有照度低、噪声严重、视觉效果差等问题,为了提高低光照环境成像质量,本文提出基于多尺度小波U型网络的低光照图像增强方法.该方法采用多级编解码器构建U型网络,并引入小波变换构建特征分频单元,分离高频和低频信息,增强对低频照度特征和高频纹理信息的感知.设计多尺度感知损失函数,指导网络学习低频...  相似文献   

12.
针对传统谱减法会产生“音乐噪声”及在低噪比环境下降噪效果不理想的问题,提出一种基于语谱图分析的语音增强算法.所提方法先对带噪语音进行谱减处理,再通过语谱图分析对处理后的语音信号进行去小亮块处理,即对“音乐噪声”进行有效的削弱,最后通过设置阈值,滤除低灰度值的成份,即消除残留近似高斯噪声.实验结果表明,提出的算法可以有效地解决谱减法后残留的“音乐噪声”及低信噪比下谱减法残留噪声较大的问题.  相似文献   

13.
14.
一种基于U-Net生成对抗网络的低照度图像增强方法   总被引:3,自引:0,他引:3       下载免费PDF全文
江泽涛  覃露露 《电子学报》2020,48(2):258-264
在低照度环境下采集的图像具有低信噪比、低对比度及低分辨率等特点,导致图像难以识别利用.为了提升低照度图像的质量,本文提出一种基于U-Net生成对抗网络的低照度图像增强方法.首先利用U-Net框架实现生成对抗网络中的生成网络,然后利用该生成对抗网络学习从低照度图像到正常照度图像的特征映射,最终实现低照度图像的照度增强.实验结果表明,与主流算法相比,本文提出的方法能够更有效的提升低照度图像的亮度与对比度.  相似文献   

15.
基于分形理论的语音增强   总被引:1,自引:0,他引:1  
在分析了语音信号与随机噪声在不同尺度上进行小波变换时其传递特性不同的特征表现及其特点之后.给出了一种新的基于分形维数的语音信号增强方法。该方法根据带噪语音信号及子渡重构之后的分形维数不同对语音信号的小波变换系数作不同的阈值处理。既抑制了噪声,又减少了语音段的信息的损失,提高了佶噪比。仿真结果表明,这是一种有效的语音增强、去噪的方法。  相似文献   

16.
姚瑶 《信息通信》2010,23(3):59-61
语音增强目的是从带噪语音中尽可能纯净的原始语音,即消除含噪语音信号中的噪声成份,提高输入信号的信噪比.在实际应用环境中,语音都会不同程度受到噪声的干扰,噪声会影响语音质量,严重的情况下将语音完全淹没到噪声中,无法分辨.本文将读入的语音信号加入正态随机噪声,然后对含噪声的语音信号进行小波分解,估计噪声的方差,然后获取去噪的阈值并对小波分解的高频系数进行阈值量化,得到去噪后的语音信号.仿真证明此方法具有很好的增强效果.  相似文献   

17.
安相君 《信息通信》2012,(3):221-222
将CDMA2000作为无线频谱移动监测系统中数据传输的通道,为无线频谱移动监测系统提供实时的数据,它使得无线频谱移动监测系统更为方便和快捷地对系统内的各种资源进行管理  相似文献   

18.
提出了一种射频标签定位的语音增强技术。该技术结合LANDMARC定位方法与传声器阵列语音增强技术构建了一个智能的语音自适应系统,可以广泛应用于舞台表演、产品展示等多种场合下的声音增强。  相似文献   

19.
本文对凌阳科技公司的处理器SPCE061A进行简要介绍,并分析了该芯片作为语音控制平台的功能的实用性,着重从语音识别功能优化,语音增强方面进行探讨及比较.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号