期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

葛良陶智《苏州大学学报(工科版)》2002,22(4):23-25

介绍了自适应滤波进行语音增强的一种方法。对带噪语音进行自适应滤波处理，滤波后的语音信噪比和听觉质量得到了很大的改善。相似文献

2.

伍彩云《沈阳理工大学学报》2011,(6):78-81,91

在语音增强系统中,当一个语音信号相对于背景噪声很强时,采用传统的LMS算法存在剩余均方误差随有用信号功率线性增加的问题,因此提出B-WSLMS算法。与传统的语音增强算法不同,B-WSLMS算法将WSLMS算法应用到组合FIR滤波器中,算法的权值根据输出功率变化进行更新,并且权值更新收敛系数与输出功率成反比进行变化,有效弥补了LMS算法的缺点。同时,通过在组合FIR滤波器中选取不同的辅助变量收敛系数,B-WSLMS算法可以使语音增强系统得到更好的信噪比提高量。仿真结果表明,在语音增强系统中,B-WSLMS算法优于LMS算法及WSLMS算法. 相似文献

3.

基于小波变换的人声语音增强技术研究

赵岩 ;王柠 ;张宝泉《齐齐哈尔轻工业学院学报》2008,(1):44-47

主要介绍了几种小波变换去噪的原理及语音增强的算法,并通过Matlab仿真结果证明了小波变换在人声语音增强方面的优良特性。相似文献

4.

基于自适应提升小波变换的语音增强算法的研究

陈立伟赵春晖姜海丽《哈尔滨工程大学学报》2005,26(5):668-671

语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.Sweldens等人引入了基于提升法的小波变换,也称为第二代小波变换.提升法是一种柔性的小波构造方法,它可以使用许多线性,非线性或者空间变化的预测和更新算子,而且可以确保变换的可逆性.该文讨论强背景噪声下的基于自适应提升小波变换的语音增强方法,并与自相关相减法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声同时保持语音信号较好的可懂度. 相似文献

5.

基于神经网络的麦克风阵列语音增强方法

赵光贾林飞王冬霞王琼《辽宁工学院学报》2005,25(3):146-148

描述了在诸如封闭环境的散射噪声场中，一种基于ADALINE神经网络的麦克风阵列语音增强方法。该方法充分利用了波束形成和神经网络的优点，对基于MLP-BP结构进行了改进，以提高神经网络的学习方法的收敛速度。仿真结果表明，和MLP-BP相比，该方法具有更好的噪声抑制性能。相似文献

6.

基于LPC全极点模型增强算法在高噪声背景下命令语音识别… 总被引：1，自引：1，他引：0

王承发孙立新《哈尔滨工业大学学报》1998,30(1):68-72

针对语音和噪音的特点,提出在高噪声条件下,用ＬＰＣ全极点模型的增强算法,进行系统次现及比较和测试,系统在较高噪声背景下,该方法具有很好的去噪效果。相似文献

7.

基于小波变换的语音增强研究

胡海波刘柏森许银《黑龙江工程学院学报》2011,25(1):43-46

提出一种新的阈值函数,分析、实现传统的小波域固定阈值增强算法和基于TEO的小波域自适应阈值增强算法,并针对其部分不足,结合小波系数相关性的特性提出一种新的语音增强算法,实验结果证明该方法是可行的,而且增强效果比前两种方法也有所改进。相似文献

8.

语音增强方法的研究

杨汇军郑海英王立红《辽宁工学院学报》2003,23(5):15-16

针对语音信号的特点研究了语音增强的目的、方法,并给出了宽带噪声、周期性噪声、脉冲噪声的语音增强方法。相似文献

9.

基于量子神经网络(QNN)的语音增强技术

徐国标王伟李飞《军民两用技术与产品》2009,(1)

将量子神经网络(QNN)应用于语音增强技术中,并与基于径向基函数神经(RBF)网络的语音增强技术进行比较.实验结果表明,基于QNN上的语音增强技术效果比基于人工神经网络(ANN)中的RBF网络的语音增强技术效果好,消噪能力强,有更好的鲁棒性.另外,该技术还能够改善语音质量. 相似文献

10.

基于强化学习的自监督语音识别模型微调技术

陈紫龙张文林《信息工程大学学报》2023,(2):150-156

近年来,基于大规模自监督预训练和微调技术的端到端连续语音识别取得显著进展,然而现有方法在模型微调阶段和测试阶段存在目标不一致性,制约其性能的进一步提升。针对此问题,提出采用强化学习技术对自监督预训练模型进行微调的方法。该方法将语音识别问题转化为序列决策问题,将预训练模型得到的语音高层表示作为环境状态编码,将词错误率作为奖励函数,将语音识别模型视为策略函数,采用策略梯度算法直接对词错误率进行优化。针对LibriSpeech语料库上的实验结果表明,基于Wav2vec2.0或Hubert预训练模型,采用强化学习微调得到的语音识别模型比采用CTC准则微调后系统的词错误率分别相对降低了6.3%和4.9%。相似文献

11.

区分性联合稀疏字典交替优化的语音增强

贾海蓉王卫梅王雁裴俊华《西安电子科技大学学报(自然科学版)》2019,46(3):74-81

在联合稀疏字典的语音增强中,由于联合字典的相似性,导致稀疏重构阶段产生语音和噪声混淆进而产生语音失真问题。针对此,在训练阶段提出一个费希尔准则下的目标函数。该函数包含了语音和噪声的区分约束项,并用与信号变化相关的平衡因子去调整各项权值,为尽可能减小混淆误差提供了保障;同时,为了能使目标函数收敛,设计了一种交替优化字典和稀疏系数的算法,迭代寻找所需的字典和稀疏系数,完成语音字典和噪声字典的输出,得到具有非相似即区分性能较好的联合字典。在增强阶段,将带噪语音信号在联合字典上进行稀疏表示,并估计出语音幅度谱和噪声幅度谱。最后,结合维纳滤波器和理想二值掩模的优点,提出了新的软掩模滤波器,进一步消除了残余噪声。通过对不同信噪比的带噪语音进行实验,新算法得到的语音信噪比和听觉感知评价都较高,验证了新算法在提高语音性能方面的有效性。相似文献

12.

基于离散余弦变换的语音增强 总被引：2，自引：0，他引：2

李雪耀谢华张汝波《哈尔滨工程大学学报》2007,28(2):198-202

在进行余弦变换时,语音信号主要分布在余弦系数的低频区域,而随机噪声主要分布在高频区域．鉴于此特点,给出了一种基于离散余弦变换的阈值语音增强方法．利用余弦系数的高频区估计噪声得到阈值,对DCT阈值化,利用信噪比估计值和语音出现概率对算法做了进一步的改进,增强了算法的去噪能力．实验结果表明,该方法为有效的语音增强方法．相似文献

13.

基于Hilbert-Huang变换理论的语音增强初探

申丽然李雪耀王慧强尹清波张汝波《哈尔滨工程大学学报》2005,26(2):220-224

希尔伯特-黄变换是新发展起来强有力的非线性、非稳态信号处理方法．它从信号自身出发自适应地产生具有物理意义的基函数,而不是人为地设定变换的基函数．该文将这一全新的方法应用到语音信号处理．希尔伯特-黄变换基于信号的局部特征时间尺度,能把复杂的信号分解为有限的内在模态函数之和,这种自适应的分解方法非常适于非线性和非平稳过程的分析．实验表明,希尔伯特-黄变换适于语音信号处理,有广阔地应用前景．结合小波变换的分析表明,该方法在语音去噪方面优于小波变换．相似文献

14.

Speech enhancement using improved phase spectrum compensation

WANG Dong JIA Hairong 《西安电子科技大学学报(自然科学版)》2017,44(3):83-88

The typical phase spectrum compensation method has the negative enhancement performance in a low SNR,so the improved phase spectrum compensation method is proposed for this problem. First, the algorithm compensates the speech spectrum through the phase compensation function obtained by calculating the signal to noise ratio of each frame; second, by the new speech presence probability algorithm to estimate the noise power spectral density; finally, we apply the new phase spectrum and the estimated noise in the wiener filter. Simulation results show that the improved algorithm proposed in this paper can effectively improve the ability of voice systems to remove noise especially in a low SNR. 相似文献

15.

利用NARMA模型辨识非线性时变结构系统

庞世伟于开平邹经湘《哈尔滨工业大学学报》2008,40(1):12-16

为了有效地进行非线性时变结构系统的辨识,提出了一种基于Kalman滤波算法的利用时变非线性自回归滑动平均模型的用于非线性时变结构系统辨识的新方法.首先,利用线性变换将非线性时不变结构系统的动力学模型转化为非线性自回归滑动平均模型,然后,将非线性项展开为系统输出数据的多项式的形式.利用短时时不变假设,通过改变模型参数跟踪系统参数的变化,将非线性时变系统的辨识问题转化为线性时变系统的辨识问题.建立系统参数的随机游动模型,引入Kalman滤波算法估计系统的参数,实现对非线性时变结构系统的辨识.最后对一个具有非线性时变刚度的三自由度结构系统进行了仿真,结果表明:该方法可以有效地跟踪非线性时变结构系统的参数变化.遗忘因子的对比试验表明只有选择合适的遗忘因子才能得到合理的结果. 相似文献

16.

Speech enhancement through voice activity detection using speech absence probability based on Teager energy

PARKYun-sik LEE Sang-min 《中南工业大学学报(英文版)》2013,20(2):424-432

In this work, a novel voice activity detection (VAD) algorithm that uses speech absence probability (SAP) based on Teager energy (TE) was proposed for speech enhancement. The proposed method employs local SAP (LSAP) based on the TE of noisy speech as a feature parameter for voice activity detection (VAD) in each frequency subband, rather than conventional LSAP. Results show that the TE operator can enhance the ability to discriminate speech and noise and further suppress noise components. Therefore, TE-based LSAP provides a better representation of LSAP, resulting in improved VAD for estimating noise power in a speech enhancement algorithm. In addition, the presented method utilizes TE-based global SAP (GSAP) derived in each frame as the weighting parameter for modifying the adopted TE operator and improving its performance. The proposed algorithm was evaluated by objective and subjective quality tests under various environments, and was shown to produce better results than the conventional method. 相似文献

17.

Speech enhancement method based on the multi-head self-attention mechanism

CHANG Xinxu ZHANG Yang YANG Lin KOU Jinqiao WANG Xin XU Dongdong 《西安电子科技大学学报(自然科学版)》2020,47(1):104-110

The human ear can only accept one sound signal at one time, and the signal with the highest energy will shield other signals with low energy. According to the above principle, this paper combines the self-attention and the multi-head attention to propose a speech enhancement method based on the multi-head self-attention mechanism. By applying multi-head self-attention calculation to the input noisy speech features, the clean speech part and the noise part of the input speech feature can be clearly distinguished, thereby enabling subsequent processing to suppress noise more effectively. Experimental results show that the proposed method significantly outperforms the method based on the recurrent neural network in terms of both speech quality and intelligibility. 相似文献

18.

感知联合优化的深度神经网络语音增强方法

袁文浩娄迎曦梁春燕王志强《西安电子科技大学学报(自然科学版)》2019,46(2):89-94

基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关联,并设计一个反映时频单元语音存在情况的感知系数,提出了一种感知联合优化的深度神经网络语音增强方法。实验结果表明,相比基于均方误差的语音增强方法,该方法显著地提高了增强语音的语音质量和可懂度,具有更好的语音增强性能。相似文献

19.

一种时频平滑的深度神经网络语音增强方法

袁文浩梁春燕娄迎曦房超王志强《西安电子科技大学学报(自然科学版)》2019,46(4):130-136

由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑, 针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间和频率两个维度上进行不同处理的时频平滑网络。该网络采用门控循环单元来表达含噪语音在时间上的相关性,同时采用卷积神经网络来表达含噪语音在频率上的相关性,实现了类似传统语音增强方法的时频平滑处理。实验结果表明,这种时频平滑网络在保证语音增强系统因果性的前提下,相比其他网络显著地提高了语音增强性能,增强后的语音具有更好的语音质量和可懂度。相似文献