首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
针对前馈神经网络难以处理时序数据的问题,提出将双向循环神经网络(BiRNN)应用在自动语音识别声学建模中。首先,应用梅尔频率倒谱系数进行特征提取;其次,采用双向循环神经网络作为声学模型;最后,测试不同参数对系统性能的影响。在TIMIT数据集上的实验结果表明,与基于卷积神经网络和深度神经网络的声学模型相比,识别率分别提升了1.3%和4.0%,说明基于双向循环神经网络的声学模型具有更好的性能。  相似文献   

2.
在日常生活中常见的非平稳噪声环境下,现有助听器语音增强算法的降噪性能有所不足。对此,本文提出了一种结合子带谱熵法与双尺度循环神经网络的助听器语音增强算法。该算法将音频划分为16个子频段,各频段的对数功率谱被用作循环神经网络的输入特征,对应的频段增益作为输出特征,并使用子带谱熵法对增益进行修正。实验结果表明,相较于传统语音增强算法,在三类不同的噪声环境中,本文提出算法的平均信噪比分别提高了4.215dB、0.906dB、11.010dB。在FPGA上对该算法进行测试?输出与计算机模拟输出的信噪比差值为 0.117dB?互相关系数为0.9994,并且当时钟频率设置为10MHz时?算法的延时约为2ms,可以满足助听器的使用需求。  相似文献   

3.
针对基于神经网络的语音增强算法难以部署在助听器中的问题,本文基于循环神经网络,提出了一种低延迟、低复杂度的双麦克风语音增强算法。该算法利用两个麦克风做空域滤波初步去除非期望方向噪声,并进一步通过循环神经网络得到纯净语音信号。为了解决助听器中全相位滤波器组阶数较多而引起群延迟较大的问题,本文创新性地提出一种分段式滤波器组,在保证性能的同时有效减少了阶数。仿真结果显示,该滤波器组在16K采样率下的群延迟为3.125 ms,在0 dB 的babble、volvo、factory1环境下,该语音增强算法的SNR平均提升了10.5565 dB,PESQ平均提升了0.6787。实际测试结果中,SNR平均提升了9.4394 dB,PESQ平均提升了0.7350。当DSP系统时钟频率为104 MHz时,助听器经过的系统延迟为8.4 ms,功耗为6.2 mA,可以很好满足助听器高续航的需求。  相似文献   

4.
基于循环神经网络的RNNoise语音增强算法在非稳态噪声环境中有着优良的噪声抑制效果,但在应对未知噪声时,存在增益估计偏差、频带增益估计过平滑的问题,而基于统计模型的MMSE-LSA语音增强算法,在噪声估计不准确的情况下,也能取得良好的噪声抑制效果.为结合两者的优良特性,将RNNoise中的频带增益估计转换为频带先验信...  相似文献   

5.
基于神经网络的语音增强任务中相位估计不准确会导致增强语音质量差,针对这一问题,提出了一种基于复数卷积循环神经网络的语音增强算法,在复数域实现语音幅度和相位的同时增强,以提高增强语音的质量。使用基于复数卷积网络的编码器在复数域提取语音局部特征,再利用复数卷积循环网络对语音的长时信息进行建模,最后使用复数卷积上采样解码器计算语音复数时频掩蔽,实现语音幅度与相位增强。在公开数据集上的实验结果表明,使用所提方法得到的增强语音在语音质量和信噪比提升中均优于主流方法,验证了该网络模型在语音增强任务中的有效性。  相似文献   

6.
论文针对带噪的耳语音提出了一种利用ADALINE神经网络消除背景噪声的耳语音增强算法。首先利用传统的谱减法来取得较好的谱包络,在此基础上使用AD线性神经网络进行自适应预测以达到提高耳语音质量的目的。结果表明,即使在低信噪比的情况下,信噪比也能提高20 dB左右,而且取得了良好的听觉效果。  相似文献   

7.
利用神经网络提高语音增强模型的性能与泛化能力.对语音信号做短时傅立叶变换并提取对数能量谱特征,使用卷积循环网络(CRN)进行拟合,理想比例掩膜(IRM)作为回归 目标.在方法上与全连接层网络、RNNoise对比,在目标上将理想比例掩膜与直接映射(DM)对比.在未训练过的噪声各个信噪比(SNR)上平均提高主观质量评分0....  相似文献   

8.
使用深度学习的语音增强技术能够提升听者的言语识别率,但因神经网络的规模较大难以应用于边缘设备中。因此,本文提出了一种可用于助听器等边缘设备的循环神经网络语音增强加速器。该加速器将神经网络的计算用独立矩阵乘法硬件实现,并在多层神经网络的层之间实现硬件级的流水操作,通过并行和流水降低了计算延时。实验表明,与带噪语音相比,在volvo、factory2、babble噪声环境下,本算法的信噪比分别平均提升了17.302dB、8.412dB、4.732dB;短时语音可懂度分别平均提高了1.4%、0.8%和0.4%;语音质量感知评估平均提高了1.498、0.504和0.234;这三项指标均高于本文所对比的传统语音增强算法与神经网络算法。当时钟频率为10 MHz时,加速器的处理延时为9.2 ms,可以满足边缘侧应用的实时性需求。  相似文献   

9.
在基于深度学习的语音增强模型中,长短时记忆网络能较好地解决序列语音增强问题,但该模型在处理大规模含噪语音数据时存在训练速度缓慢的问题.为此,提出一种基于准循环神经网络的语音增强方法.利用门函数和记忆单元确保含噪语音序列上下文的相关性,门函数的计算不再依赖上一时刻的输出,且该模型在含噪语音序列的输入和门函数的计算中都引入矩阵的卷积运算,使模型可以同时处理多个时刻的语音序列信息,从而增强模型并行计算的能力.实验结果表明,与长短时记忆网络相比,该方法能在保证语音增强性能的前提下,有效提高网络模型的训练速度.  相似文献   

10.
现有的数字语音取证研究主要集中于对单一的某种操作进行检测,无法对不相关的操作进行判断。针对该问题,提出了一种能够同时检测经过变调、低通滤波、高通滤波和加噪这四种操作的数字语音取证方法。首先,计算语音的归一化梅尔频率倒谱系数(MFCC)统计矩特征;然后通过多个二分类器对特征进行训练,并组合投票得到多分类器;最后使用该多分类器对待测语音进行分类。在TIMIT以及UME语音库上的实验结果表明,归一化MFCC统计矩特征在库内实验中均达到了97%以上的检测率,且在对MP3压缩鲁棒性测试的实验中,检测率仍能保持在96%以上。  相似文献   

11.
李江和  王玫 《计算机工程》2022,48(11):77-82
传统基于深度学习的语音增强方法为了提高网络对带噪语音的建模能力,通常采用非因果式的网络输入,由此导致了固定时延问题,使得语音增强系统实时性较差。提出一种用于因果式语音增强的门控循环神经网络CGRU,以解决实时语音增强系统中的固定时延问题并提高语音增强性能。为了更好地建模带噪语音信号的相关性,网络单元在计算当前时刻的输出时融合上一时刻的输入与输出。此外,采用线性门控机制来控制信息传输,以缓解网络训练过程中的过拟合问题。考虑到因果式语音增强系统对实时性要求较高,在CGRU网络中采用单门控的结构设计,以降低网络的结构复杂度,提高系统的实时性。实验结果表明,CGRU网络在增强后的语音感知质量、语音客观可懂度、分段信噪比指标上均优于GRU、SRNN、SRU等传统网络结构,在信噪比为0 dB的条件下,CGRU的平均语音感知质量和平均语音客观可懂度分别达到2.4和0.786。  相似文献   

12.
In a binaural hearing aid system, output signals need to be generated for the left and the right ear. Using the binaural multichannel Wiener filter (MWF), which exploits all microphone signals from both hearing aids, a significant reduction of background noise can be achieved. However, due to power and bandwidth limitations of the binaural link, it is typically not possible to transmit all microphone signals between the hearing aids. To limit the amount of transmitted information, this paper presents reduced-bandwidth MWF-based noise reduction algorithms, where a filtered combination of the contralateral microphone signals is transmitted. A first scheme uses a signal-independent beamformer, whereas a second scheme uses the output of a monaural MWF on the contralateral microphone signals and a third scheme involves an iterative distributed MWF (DB-MWF) procedure. It is shown that in the case of a rank-1 speech correlation matrix, corresponding to a single speech source, the DB-MWF procedure converges to the binaural MWF solution. Experimental results compare the noise reduction performance of the reduced-bandwidth algorithms with respect to the benchmark binaural MWF. It is shown that the best performance of the reduced-bandwidth algorithms is obtained by the DB-MWF procedure and that the performance of the DB-MWF procedure approaches quite well the optimal performance of the binaural MWF.  相似文献   

13.
Neural Network-Based Artificial Bandwidth Expansion of Speech   总被引:1,自引:0,他引:1  
The limited bandwidth of 0.3-3.4 kHz in current telephone systems reduces both the quality and the intelligibility of speech. Artificial bandwidth expansion is a method that expands the bandwidth of the narrowband speech signal in the receiving end of the transmission link by adding new frequency components to the higher frequencies, i.e., up to 8 kHz. In this paper, a new method for artificial bandwidth expansion, termed Neuroevolution Artificial Bandwidth Expansion (NEABE) is proposed. The method uses spectral folding to create the initial spectral components above the telephone band. The spectral envelope is then shaped in the frequency domain, based on a set of parameters given by a neural network. Subjective listening tests were used to evaluate the performance of the proposed algorithm, and the results showed that NEABE speech was preferred over narrowband speech in about 80% of the test cases  相似文献   

14.
全球老龄化使听力障碍成为高发性慢性疾病,而佩戴助听器是老年性聋患者听力干预和康复最有效的手段之一。随着数字信号处理技术和电子技术的飞速进步,近年来应用于数字助听器的各种算法和技术得到了显著的发展。其中声场景分类、滤波器分解、噪声抑制和回声消除是助听器 的4个基本算法。基于对这些算法的研究,本文从算法基本原理、当前研究现状、算法特点以及存在的问题进行分析介绍。此外,通过分析现阶段数字助听器算法中存在的问题, 介绍了3个助听器信号处理方面的最新研究方向——听觉仿生、听觉认知和自验配助听器。本文最后对未来研究进行了展望。  相似文献   

15.
喉振传声器以其优良的抗噪声特性已在多种强噪声场景中得到应用,但其产生的语音尚存在着中频成份厚重、高频成份缺失等问题,严重影响了语音的清晰度和可懂度。为改善喉振传声器的语音质量,本文提出了一种基于长短时记忆递归神经网络(Long short term memory recurrent neural networks, LSTM-RNN)的喉振传声器语音盲增强算法。与基于低维的谱包络特征估计算法不同,该算法首先利用LSTM-RNN对喉振传声器语音与空气传导语音的高维对数幅度谱之间的转换关系进行建模,能有效捕捉上下文信息实现语音幅度谱的重构,然后采用非负矩阵分解(Non-negative matrix factorization, NMF)对估计出的语音幅度谱进行处理,有效抑制了过平滑问题,进一步提高了语音质量。仿真实验得到的LLR,LSD,PESQ性能指标表明,该算法可有效改善喉振传声器的语音质量。  相似文献   

16.
基于MATLAB的谱相减语音增强算法的研究   总被引:5,自引:0,他引:5  
曹晓琳  张素莉  吴平  丁铁夫 《计算机仿真》2006,23(3):278-280,283
谱相减算法运算量小、便于快速处理、效果好,是一种重要的语音增强算法。针对谱相减法经典形式存在的“音乐噪声”残留问题,人们提出了各种改进形式。该文以这一类语音增强算法作为对象,对“音乐噪声”的消除方法进行了研究。介绍了谱相减法经典形式及多种改进形式的基本原理,并基于MATLAB,详细说明了算法具体的实现过程。结合实录语音样本,给出了不同形式谱相减法增强后的结果,对各种方法的效果进行了对比,总结了使用经验,并以此为基础提出了一种提高处理后带噪语音信噪比的改进方案。  相似文献   

17.
在噪声环境下双麦克风语音增强应用中,由于麦克风之间存在交叉串扰,传统自适应对消算法降噪性能受到极大的哪影响.为了提高降噪系统性能,提出了一种基于神经元网络双麦克风自适应抗交叉串扰语音增强方法.该方法通过设置两级自适应算法,消除了麦克风之间的交叉串扰,其中自适应算法均采用神经元网络对消方法.算法仿真基础上,运用DSP制作了实时降噪处理样机.测试结果表明,采用新方法后,系统噪声抑制性能得到了很大的提高.  相似文献   

18.
提出了一种改进的仿射投影算法。该算法建立了步长因子与误差能量之间一种新的非线性函数关系,根据误差能量的变化自动调整步长因子,以达到加快滤波器收敛速度、降低稳态失调的目的;在对误差能量的估计中提出了遗忘因子选择规则,提高了误差能量估计的准确性。对提出的算法进行的数学分析,为其快速收 敛性提供了理论依据。实验仿真表明,与传统的自适应算法以及固定步长的仿射投影算法相比,提出的改进仿射算法在收敛速度、稳态失调等方面有明显改善。  相似文献   

19.
针对数字助听器中回声消除算法计算复杂度高的问题,提出了一种基于集员滤波(Set membership filtering, SMF)理论的变步长基于L0范数的改进比例归一化最小均方误差算法(L0-norm constrained improved proportional NLMS, L0-IPNLMS)算法。该算法将集员滤波的时变步长引入到L0-IPNLMS算法中,不仅提高了系统的收敛特性,而且充分利用了集员滤波理论的数据选择更新特性,在误差幅度有界的前提下进行滤波器系数的更新,减少了不必要的迭代次数,降低了数字助听器的功耗。仿真实验表明,与L0-IPNLMS算法相比,结合集员滤波和L0范数的改进比例归一化最小均方误差算法(L0-Norm constrained improved proportional NLMS based on set membership filtering theory, SM-L0-IPNLMS)算法在保留稀疏性的同时,计算复杂度降低了15.3%,在以随机信号和真实语音作为输入信号时收敛速度分别提高了28%、32.8%,失调量分别降低了1 dB、3 dB,均方误差分别降低了0.66 dB和1.68 dB,回声损失值则分别提升了0.7 dB和1.79 dB。此外,算法在低信噪比的输入条件下也具有较强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号