期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法 总被引：1，自引：0，他引：1

王振力裴凌波于元斌《智能系统学报》2008,3(6)

提出一种基于语音增强算法的噪声鲁棒语音识别方法．在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比．然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声．实验结果表明,在低信噪比（-12—0 dB）条件下,该方法对于数字语音识别具有较好的识别率,其性能明显优于基本的Mel频段倒谱参数识别器、传统的谱减法和噪声对消语音增强法．相似文献

2.

一种新的强噪声环境下的语音增强算法

蒋建中张东方张连海《计算机工程与应用》2013,49(20):222-225

针对强噪声环境下语音增强中噪声估计和先验信噪比估计算法导致的语音失真和音乐噪声的问题,利用语音和噪声的统计模型的对称性得到一种噪声幅度的估计值为参考,提出了一种噪声估计算法,改进了先验信噪比估计算法,形成了一种新的增强算法,适用于强噪声环境下的语音增强。由仿真实验给出的客观评分看出,在0 dB乃至－5 dB条件下,给出信噪比估计算法能够有效减小信号失真,基本上没有残留音乐噪声。相似文献

3.

联合听觉掩蔽效应的子空间语音增强算法 总被引：1，自引：0，他引：1

下载免费PDF全文

贾海蓉张雪英白静《计算机工程》2011,37(8):259-261

在经典子空间语音增强算法中,因语音特征值估计偏差会造成语音失真和音乐噪声。针对该问题,提出一种联合听觉掩蔽效应的语音增强算法。该算法联合掩蔽阈值自适应调节噪声特征值的抑制系数,并利用维纳滤波对音乐噪声的抑制性,对该特征值并行修正,最终还原出纯净的语音。实验结果证明,该算法在白噪声和有色噪声的背景下,与经典子空间的语音增强算法相比,能提高信噪比,减少语音失真和音乐噪声。相似文献

4.

稀疏低秩模型及相位谱补偿的语音增强算法

下载免费PDF全文

王虎李晶赵恒淼臧燕李春堂《计算机工程与应用》2018,54(5):150-155

针对现有的语音增强算法存在增强效果差、语音信号失真等问题,提出了稀疏低秩模型及改进型相位谱补偿的语音增强算法。首先,用稀疏低秩模型处理含噪语音的幅度谱,得到分离后的语音。接着,用归一化最小均方自适应滤波算法优化相位谱补偿算法的补偿因子。然后,对稀疏低秩分离后的语音进行改进型相位谱补偿处理,得到最终增强的语音。最后,对增强后的语音进行感知语音质量评价分析及频谱分析。实验结果表明,该方法能够有效地去除噪声,并且在低信噪比的情况下,可以保持语音的清晰度。相似文献

5.

基于增益字典查询的语音增强算法

庞亮陈亮张翼鹏黄清泉《计算机科学》2015,42(10):16-19

对于基于统计模型的语音增强算法,不同分布模型对应于不同的增益函数,由于语音信号的不确定性,没有一种分布函数能准确对语音和噪声谱的分布建模,因此任何一种固定的统计模型均会存在一定的误差。所以提出一种增益字典查询的语音增强算法,该算法通过采用对数谱失真准则对一个语音噪声库进行增益的训练,得到一个增益的字典,其中输入为先验信噪比和后验信噪比的估计值。最后采用ITU-T P.826 PESQ、分段信噪比、总信噪比和对数谱失真对该算法进行了测试,并与基于高斯分布模型、拉普拉斯分布模型的算法进行了对比。实验结果表明,该算法无论在非平稳噪声还是平稳噪声环境下都比其他几种算法增强效果好,且音乐噪声和残留背景噪声也可以得到很好的抑制。相似文献

6.

改进相位谱补偿的语音增强方法

下载免费PDF全文

吉慧芳贾海蓉王雁《计算机工程与应用》2019,55(8):48-52

针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号，使得语音主观感知质量改善受限的情况，提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数，能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿；结合改进DD的先验信噪比估计与语音存在概率算法（SPP）来估计噪声功率谱；在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿（PSC）算法而言，改进算法可以有效抑制音频信号中的各类噪声，同时增强语音信号感知质量，提升语音的可懂度。相似文献

7.

多阶段生成器与时频鉴别器的GAN语音增强算法

陈宇尹文兵高戈王霄曾邦陈怡《计算机系统应用》2022,31(7):179-185

传统生成对抗网络的语音增强算法(SEGAN)将时域语音波形作为映射目标, 在低信噪比条件下, 语音时域波形会淹没在噪声中, 导致SEGAN的增强性能会急剧下降, 语音失真现象较为严重. 针对该问题, 提出了一种多阶段的时频域生成对抗网络的语音增强算法(multi-stage-time-frequency SEGAN, MS-TFSEGAN). MS-TFSEGAN采用了多阶段生成器与时频域双鉴别器的模型结构, 不断对映射结果进行完善, 同时捕获时域与频域信息. 另外, 为了进一步提升模型对频域细节信息的学习能力, MS-TFSEGAN在生成器损失函数中引入了频域L1损失. 实验证明, 在低信噪比条件下, MS-TFSEGAN的语音质量和可懂度与SEGAN相比分别提升了约13.32%和8.97%, 作为语音识别前端时在CER上实现了7.3%的相对提升. 相似文献

8.

面罩语音质量评价算法适用性研究

王霞马俊晖王光艳张艳《计算机工程与应用》2017,53(19):114-117

针对语音编码的音质评价算法性能已十分明确,但对于面罩语音不一定适用。讨论了语音质量评价算法对空气语音与面罩语音在不同噪声环境下的适用性。采用主观意见得分和三种客观评价测度对多种信噪比的带噪语音和增强语音进行评价,包括分段信噪比、改进的巴克谱失真（MBSD）和语音感知质量评价（PESQ）,根据与主观评价的一致性判断客观评价方法的适用性。增强算法采用维纳滤波法和对数谱最小均方误差法（LSA-MMSE）,噪声采用粉红噪声、海浪噪声。仿真结果表明,语音质量评价算法的适用性与语音类型、信噪比、背景噪声、增强算法种类有关。粉红噪声环境下,PESQ不适合评价经维纳滤波增强的空气语音;MBSD算法只适用于评价经LSA-MMSE增强的面罩语音。海浪噪声环境下,PESQ适用于评价面罩语音,MBSD不适合评价面罩语音。相似文献

9.

一种听觉掩蔽效应和维纳滤波的语音增强算法

下载免费PDF全文

李宁蒋建中郭军利《计算机工程与应用》2011,47(29):161-163

将非平稳噪声估计算法以及基于听觉掩蔽效应得到的噪声被掩蔽概率应用于维纳滤波语音增强中,提出了一种听觉掩蔽效应和维纳滤波的语音增强方法。几种噪声背景下对语音增强的客观测试表明,提出的算法相比较于传统的维纳滤波语音增强算法而言不但可以提高语音信噪比,而且可以明显减少语音失真。相似文献

10.

联合改进子空间的自适应小波包阈值语音增强算法

《计算机应用与软件》2016,(5)

针对传统自适应小波包阈值算法增强的语音存在失真的问题,提出联合改进子空间的自适应小波包阈值语音增强算法。提出的新算法对带噪语音首先做KL变换(Karhunen Loeve Transform)得到其特征值,并用自适应小波包阈值算法对该特征值进行处理,以去除部分噪声子空间;接着用递归最小二乘算法(RLS)对噪声的特征值进行估计,修正传统子空间算法容易导致的特征值估计偏差问题;最后用经过自适应小波包阈值算法处理得到的新的特征值减去噪声特征值,以去除所有噪声子空间并由KL逆变换最终还原出纯净语音。仿真结果表明新算法相比传统自适应小波包阈值算法有更优的增强效果,减少了语音失真。并且在信噪比较低的情况下,新算法对增强的语音的信噪比和分段信噪比提高得更多。相似文献

11.

OM-LSA和小波阈值去噪结合的语音增强

刘凤增李国辉李博《计算机科学与探索》2011,5(6):547-552

针对OM-LSA(optimally modified log-spectral amplitude estimator)算法产生的残留噪声,提出了一种结合OM-LSA和小波阈值去噪的语音增强算法。首先,进行语音对数幅度谱估计;然后,估计残留噪声,利用带噪语音第一级小波系数和语音不存在时的增益函数进行估计,解决了常规方法对增强后语音噪声估计不准确的问题;最后,在小波域利用软阈值法对语音信号进行阈值处理。实验结果表明,提出的算法有效地去除了OM-LSA算法中的残余噪声,在分段信噪比(segmental signal-to-noise ratio,SegSNR)和对数谱失真(log-spectral distortion,LSD)等指标评价上有较大的提高。相似文献

12.

基于噪声估计和听觉掩蔽效应的语音增强

下载免费PDF全文

程塨郭雷刘爱峰赵天云《计算机工程与应用》2011,47(7):146-148

针对非平稳噪声环境和低信噪比的情况,提出了一种基于低频区语音特性的非平稳噪声估计方法,通过构造一个时变的权值,实现对噪声的实时估计,同时结合人耳听觉掩蔽效应,利用估计出的噪声自适应设定增强系数。仿真实验表明,该方法能够较好地抑制背景噪声,提高信噪比,减少语音失真。相似文献

13.

基于声纹嵌入的语音增强算法

高戈曾邦王霄尹文兵陈怡《计算机应用研究》2022,39(3):688-692

频域语音增强算法在高信噪比的条件下有明显的降噪效果,而在低信噪比条件下频域语音增强算法的性能会大幅下降。针对这个问题,将基于声纹的掩码应用到频域语音增强网络,利用声纹的先验信息,提升网络对说话人和噪声的区分度。另外,为了进一步改善频域语音算法在低信噪比条件下的性能,提出基于映射的声纹嵌入语音增强算法,避免了可能因采用掩模方案造成的语音失真问题。实验结果表明,在引入相同声纹信息时,基于映射的声纹嵌入语音增强网络在低信噪比条件下的增强性能表现更好,特别是在改善语音失真方面优势明显。相较于基于掩模的声纹掩码网络,基于映射的声纹嵌入网络在PESQ、STOI和SSNR这三项指标上分别实现了6.40%、1.46%和24.84%的相对提升。相似文献

14.

An iterative longest matching segment approach to speech enhancement with additive noise and channel distortion

《Computer Speech and Language》2014,28(6):1269-1286

This paper presents a new approach to speech enhancement from single-channel measurements involving both noise and channel distortion (i.e., convolutional noise), and demonstrates its applications for robust speech recognition and for improving noisy speech quality. The approach is based on finding longest matching segments (LMS) from a corpus of clean, wideband speech. The approach adds three novel developments to our previous LMS research. First, we address the problem of channel distortion as well as additive noise. Second, we present an improved method for modeling noise for speech estimation. Third, we present an iterative algorithm which updates the noise and channel estimates of the corpus data model. In experiments using speech recognition as a test with the Aurora 4 database, the use of our enhancement approach as a preprocessor for feature extraction significantly improved the performance of a baseline recognition system. In another comparison against conventional enhancement algorithms, both the PESQ and the segmental SNR ratings of the LMS algorithm were superior to the other methods for noisy speech enhancement. 相似文献

15.

多数据流子带噪声语音识别方法

蒋文建韦岗《计算机工程与应用》2001,37(19):52-54

提出一种噪声下的多数据流子带语音识别方法。传统的子带特征方法虽然能提高噪声下的语音识别性能,但通常会使无噪声情况下的识别性能下降。新方法提取感知线性预测(PLP)特征和子带特征,分别进行识别,然后在识别概率层将两者相结合。通过E-Set在NoiseX92下的白噪声的识别实验表明,新方法不仅具有更好的抗噪性能,而且同时能提高无噪声情况下的识别性能。相似文献

16.

联合稀疏非负矩阵分解和神经网络的语音增强

时文华倪永婧张雄伟邹霞孙蒙闵刚《计算机研究与发展》2018,55(11):2430-2438

针对基于非负矩阵分解(non-negative matrix factorization, NMF)的语音增强方法在低信噪比部分和无结构特征的清音部分会引入失真这一问题,利用语音信号在时频域呈现的稀疏特性和深度神经网络在语音增强应用中表现出的谱重构特性,提出了一种联合稀疏非负矩阵分解和深度神经网络的单通道语音增强方法.首先对带噪语音的幅度谱进行非负矩阵分解得到与语音字典和噪声字典相对应的稀疏编码矩阵,其中语音字典和噪声字典通过对纯净语音和噪声进行训练预先得到,以维纳滤波方法恢复出语音成分的主要结构;然后利用深度神经网络在语音增强中表现出的时频保持特性,通过深层网络学习经维纳滤波分离出的语音的对数幅度谱和理想纯净语音对数幅度谱之间的非线性映射函数,进而恢复出语音结构的缺失成分.实验结果表明：所提方法可以有效抑制噪声且较好地恢复出语音成分,在语音感知质量和对数谱失真性能评价指标上均优于基线方法. 相似文献

17.

基于时频结合的背景噪声下语音增强方法 总被引：2，自引：0，他引：2

王让定柴佩琪《小型微型计算机系统》2003,24(7):1260-1263

本文在研究基于改进谱减法的基础之上,提出了在频域利用谱减法去除宽带加性噪声,在时域利用短时过零率和短时能量组合而成的加权函数去除谱减法后产生的“音乐噪声”的方法．实验表明：这种时频结合的语音增强方法对背景噪声下的语音质量的增强效果明显。相似文献