首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 31 毫秒
1.
为了提升复杂噪声环境下语音增强效果,该文提出了一种基于双层字典学习的单通道语音增强方法。在训练阶段首先采用干净语音和噪声训练初始化特征子字典,然后基于区分性约束和抗混淆约束的优化函数训练双层联合字典,第一层字典表达语音信号和噪声的可区分分量,而第二层字典表达语音信号和噪声的易混淆成分。在测试阶段含噪语音在双层联合字典上投影得到稀疏系数矩阵,然后重构得到增强后的语音。该方法利用目标优化函数的约束性减少“交叉投影”现象的发生,降低了信号在联合字典的混淆,从而进一步提升了语音增强的效果。实验结果表明,从全局信噪比(SNR)、主观语音质量评估(PESQ)和对数频谱距离(LSD)三个方面评价,相比于基于稀疏约束非负矩阵分解和改进的维纳滤波的语音增强方法,该方法具有更好的性能,能够更有效地去除噪声。   相似文献   

2.
本文提出了一种改进的非负矩阵分解语音增强算法,该算法可分为训练和增强两部分。首先,为了降低训练复杂度,采用卷积非负矩阵分解只提取噪声字典。增强时,考虑语音信号稀疏性比噪声信号稀疏性强,通过稀疏非负矩阵分解重构出语音幅度谱,采用交替方向乘子法进行优化迭代,克服了经典乘性迭代易陷入局部最优、分母只能收敛到零极限等问题。最后,基于算法融合的思想,将重构的语音幅度谱与谱减法、最小均方误差幅度谱估计得到的幅度谱进行加权融合。仿真实验中,在10种不同噪声环境中,通过多种评价标准证明所提算法能取得较好的增强效果。   相似文献   

3.
基于数据驱动字典和稀疏表示的语音增强   总被引:1,自引:0,他引:1       下载免费PDF全文
孙林慧  杨震 《信号处理》2011,27(12):1793-1800
本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(K singular value decomposition, K SVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语音增强方法那样减少或消去噪声,而是从字典中选取适当的原子表示纯净信号,从而把纯净信号从含噪信号中分离出来。对白噪声和有色噪声环境下重构语音进行了主客观评价。仿真结果显示:该方法能有效去除加性噪声,并且改善了语音质量。   相似文献   

4.
吕勇  周琳 《电声技术》2013,(12):57-60,69
提出了一种基于最小统计和人耳掩蔽特性的语音增强算法,通过最优平滑和最小约束递归平均从含噪语音中估计噪声的均值,推导出一种新的基于掩蔽特性的谱减系数计算公式。实验结果表明,该算法优于传统的掩蔽特性算法,含噪语音经过增强后,残留的音乐噪声更小。  相似文献   

5.
张天骐  张晓艳  周琳  胡延平 《信号处理》2020,36(11):1867-1876
相位谱补偿语音增强算法通过调整相位谱对噪声进行压缩,提高重构信号的质量。针对传统的相位谱补偿(phase spectrum compensation, PSC)语音增强算法采用固定的相位补偿因子,且算法的性能易受噪声估计准确性的影响,提出了一种基于稀疏性的相位谱补偿(sparsity-based phase spectrum compensation, SPSC)语音增强算法。首先,利用噪声估计算法得到噪声幅度谱,利用基于幅度谱的语音增强算法得到目标语音幅度谱;接着,通过噪声和目标语音幅度谱之间的局部信噪比(Signal-to-Noise Ratio, SNR)来估计谱时间稀疏性;然后,利用sigmoid函数改进相位补偿因子,联合补偿因子和谱时间稀疏性,得到SPSC函数。最后,使用SPSC函数对相位谱中的谱分量进行补偿,通过短时傅里叶逆变换得到最终增强后的语音信号。仿真实验表明,在四种不同背景噪声的低信噪比下,新的相位谱补偿算法使增强语音获得了更好的LSD、PESQ和segSNR指标,说明新的算法在低信噪比下,可以有效恢复带噪语音中的语音成分,对噪声抑制效果明显,增强语音的质量和听感均有一定提升。   相似文献   

6.
语音增强是消除噪声干扰的主要手段,在语音处理系统中得到广泛应用。传统语音增强算法认为相邻帧语音幅度谱之间是相互独立的,而研究表明语音幅度谱时频点之间存在相互依赖关系。缺乏对邻域时频结构信息的利用使得传统增强算法的性能难以进一步提高。本文首次将数据场引入到对语音的听觉感知领域,用数据场对语音的时频依赖性进行建模,提出一种新的基于数据场的语音增强算法。该算法通过最小化势场分布的熵确定了时频点之间的相互作用力程,在带噪语音数据场中估计噪声的最小统计量得到二值时频掩蔽值,最后利用二值时频掩蔽消除噪声干扰。实验测试表明,与Martin算法相比,基于数据场的语音增强算法在提高去噪效果的同时能有效减少语音的失真。   相似文献   

7.
《现代电子技术》2019,(1):46-50
针对传统小字典的语音增强算法在消除噪声时导致语音失真的问题,提出一种子空间域的自适应小字典的语音增强算法。首先,在子空间域中利用带噪语音信号的特征值构造过完备的小字典,使得该字典对信号失真和残留噪声具有很好的调控机制,即在消除噪声的同时为保证信号失真尽可能的小提供了可能;其次,通过过完备的小字典对带噪语音的特征值用K奇异值分解(K-SVD)算法不断进行稀疏表示和字典更新,其中在正交匹配追踪(OMP)算法中设置相关性阈值与能量阈值来自适应控制重构阶段及迭代次数,减少重构时间。在不同的噪声背景下的实验结果表明,与文献算法相比,新算法的增强语音的SNR和PESQ较高,减少了语音失真,提高了语音质量。  相似文献   

8.
李嘉新  魏爽  俞守庚  刘睿 《电讯技术》2023,63(9):1411-1418
针对欠定盲语音分离传统字典学习算法不能优化字典尺寸的问题,提出了一种尺度自适应同步码字优化(Scale Adaptive Simultaneous Codeword Optimization, SASimCO)算法。设计了一种迭代调整字典尺寸的自适应字典学习策略,将训练的字典用于语音盲分离中,以提高语音源信号的恢复性能。所提算法依据设计的候选矩阵,计算候选矩阵中的原子重要性,按照原子重要性准则对字典进行添加与删除原子操作,最后迭代训练得到一个稀疏表示误差最优的字典,用于语音源信号的恢复。使用SiSEC(Signal Separation Evaluation Campaign)数据集对所提算法进行的仿真实验表明,相较于传统字典学习算法,所提算法提高了1~3 dB语音源分离性能,证明了该算法的优势。  相似文献   

9.
提出的算法利用带噪信号进行训练以获得过完备字典,通过设定较大的字典训练阈值,训练过程只对语音信号进行,使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示,进而实现语音增强。仿真实验表明,增强后的信号表示系数稀疏度更强,增强效果在信噪比(SNR)和感知语音质量评估(PESQ)得分方面均有较大改进。  相似文献   

10.
白志刚  鲍长春 《信号处理》2020,36(6):831-838
基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法需要和背景噪声类型匹配的噪声基矩阵(Basis matrix),而在实际中,这是很难被保证的。本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法,该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域,然后利用一个固定长度的滑动窗口(Sliding window)来包含若干帧最近过去的带噪语音的无语音帧,并用这些无语音帧的幅度谱在线更新噪声基矩阵,最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵,有效地解决了噪声基矩阵不匹配的问题。实验证明,本文所提的方法在线学习到的噪声基矩阵在大多数条件下比匹配训练集下训练得到的噪声基矩阵的性能还要优越。   相似文献   

11.
This paper describes an algorithm to suppress composite noise in a two‐microphone speech enhancement system for robust hands‐free speech communication. The proposed algorithm has four stages. The first stage estimates the power spectral density of the residual stationary noise, which is based on the detection of nonstationary signal‐dominant time‐frequency bins (TFBs) at the generalized sidelobe canceller output. Second, speech‐dominant TFBs are identified among the previously detected nonstationary signal‐dominant TFBs, and power spectral densities of speech and residual nonstationary noise are estimated. In the final stage, the bin‐wise output signal‐to‐noise ratio is obtained with these power estimates and a Wiener post‐filter is constructed to attenuate the residual noise. Compared to the conventional beamforming and post‐filter algorithms, the proposed speech enhancement algorithm shows significant performance improvement in terms of perceptual evaluation of speech quality.  相似文献   

12.
周健  赵力  陶亮  金赟 《信号处理》2010,26(12):1870-1876
传统变换域语音增强方法对语音做短时平稳性假设,这会造成对语音信号和噪声信号谱估计不准确,从而导致语音失真和残留噪声。本文提出一种从联合时频域进行语音增强的方法,该算法无需对语音做短时平稳假设。算法采用具有最佳能量聚集特性的高斯变换核函数,利用能快速实现的实值离散Gabor变换(RDGT)将语音信号变换到联合时频域,然后利用语音和噪声谱服从高斯分布的假设和无语音概率的思想进行基于最小均方误差的语音对数谱估计,采用改进的最小受控递归平均算法(IMCRA)进行噪声时频谱估计,在得到纯净语音的谱估计后利用实值离散Gabor逆变换获得纯净语音估计。实验表明,该算法相比频域变换算法具有较好的语音去噪度和较低的语音失真度。   相似文献   

13.
一种基于改进的谱减法的语音增强算法   总被引:2,自引:1,他引:1  
为改善语音质量,提高语音识别系统的性能,提出了一种新的基于改进的谱减法的语音增强算法。新算法在所有噪声都能转化为加性高斯白噪声的基础上,依据高斯白噪声幅度谱服从瑞利分布的特点,对噪声幅度谱进行精确的估计,并采用频带方差进行端点检测以及时检出语音。仿真分析表明:该方法能够较好地抑制噪声,噪声消除效果较传统算法具有明显的提高。  相似文献   

14.
本文通过将语音信号处理与图信号处理相结合,为语音样点构建出一种基于遗忘因子的遗忘图拓扑结构,利用基于遗忘图拓扑结构的图邻接矩阵所定义的图傅里叶变换(Graph Fourier Transform, GFT),研究语音图信号的图频域特性。并在此研究基础上,本文将基于自适应子带谱熵(Adaptive Band-partitioning Spectral Entropy, ABSE)算法的端点检测方法拓展至图频域,设计了一种图自适应子带谱熵(Graph Adaptive Band-partitioning Spectral Entropy, GABSE)算法。实验表明,本文所提出的基于遗忘图的GABSE算法可以使得语音段与非语音段谱熵差异更加显著,较传统ABSE算法端点检测及rVAD语音端点检测方法正确率提高了10%~20%,同时也验证了此语音遗忘图结构有效性。   相似文献   

15.
基于多特征的语音端点检测技术研究   总被引:1,自引:0,他引:1  
何彬  柳平  王琦  程行甫  韩林呈 《通信技术》2010,43(11):139-141
针对传统的端点检测技术,如基于能量、过零率等方法,在低信噪比噪声环境下检测性能急剧下降的问题,根据汉语语音发音的特点,提出了一种新的检测方法,该方法结合了Mel频率倒谱系数(MFCC)和能量、过零率、频带方差等多个语音特征。基于多特征融合的模糊判决二次搜索端点检测方法,能有效减少清音、拖尾音的截断,提高端点检测的精度,并对噪声环境具有一定的自适应性。实验结果表明,即使在低信噪比条件下,该方法仍具有较高的准确性。  相似文献   

16.
针对传统谱减法具有残余音乐噪声过强,清音部分损失严重的缺点,提出了一种利用语音信号的短时平均幅度差特征(AMDF)并结合短时平均幅度(AM)的语音检测算法,在原始语音估计式中引入了参数α和β,对传统的谱减法进行改进。根据采集的真实带噪语音数据,将传统谱减法和改进的谱减法结果进行了比较分析。在研究基于改进的谱减法的语音增强算法基础上,构建了以TMS320VC5509和TLV320AIC23 Codec为核心器件的实时系统,能够有效地提高语音信噪比.信号的信噪比由12.2dB提高到了4.0dB.改善了语音质量。  相似文献   

17.
针对谱减语音增强法中一直存在的去噪度、残留的音乐噪声和语音畸变度三者间均衡这一关键问题,本文提出一种基于无语音概率改进的对数谱估计增强算法.该算法结合无语音概率的思想,按照纯噪声帧和带噪语音帧两种状态.有区别地实时更新语音最小均方误差的对数谱增益,并利用无语音概率参数(SAP)自适应地调节平滑系数,以求随着噪声环境的变化,在去噪度、残留"音乐噪声"和语音畸变度之间自适应地折中.实验表明,该算法在相同去噪程度下,语音畸变和音乐噪声相对其他谱减法都同时地减弱,特别在低信噪比环境下优势更明显,而且平滑参数利用SAP参数,无需多余计算,便于实时处理.  相似文献   

18.
在OFDM系统信道估计中,准确的时域卡尔曼滤波(TDKF)估计需要信道多径时延作为先验条件,而且具有较低的频谱效率.考虑到大多数无线信道具有稀疏和时变的特性,提出一种改进的卡尔曼滤波与压缩感知联合信道估计方法,采用稀疏度自适应匹配追踪(SAMP)算法,并对信道响应变化量进行重建.仿真结果表明,相较于已有算法,提出的算法不需要知道信道的稀疏度,而且信道估计结果更加准确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号