期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吕乾坤高勇《电声技术》2014,38(12):50-54

针对传统语音增强方法在非平稳噪声环境下增强效果不理想的问题,提出了一种基于稀疏约束的概率潜分量分析(PLCA)和谱掩蔽的语音增强算法。该算法分为训练和增强两个阶段。训练阶段用稀疏约束的PLCA(SPLCA)和无约束的PLCA分别对语音谱和噪声谱建模成意义清晰的边缘分布,并用期望最大(EM)算法求其最优边缘分布,得到语音字典和噪声字典。增强阶段固定训练的字典,利用SPLCA推导出对应的语音编码矩阵和噪声编码矩阵,初步重构出语音和噪声,最后利用谱掩蔽得到增强语音。实验结果表明,该算法在抑制噪声、提高信噪比和减少语音失真方面要优于传统方法。相似文献

2.

基于数据驱动字典和稀疏表示的语音增强 总被引：1，自引：0，他引：1

下载免费PDF全文

孙林慧杨震《信号处理》2011,27(12):1793-1800

本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(K singular value decomposition, K SVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语音增强方法那样减少或消去噪声,而是从字典中选取适当的原子表示纯净信号,从而把纯净信号从含噪信号中分离出来。对白噪声和有色噪声环境下重构语音进行了主客观评价。仿真结果显示:该方法能有效去除加性噪声,并且改善了语音质量。相似文献

3.

不相关匹配追踪的分段区分性特征变换方法

下载免费PDF全文

陈斌牛铜张连海屈丹李弼程《电子学报》2016,44(12):2924-2931

为了提高基于分帧特征变换方法的稳定性,提出了一种基于分段的区分性特征变换方法.该方法将特征变换当成高维信号的稀疏逼近问题,采用状态绑定的方法训练得到基于域划分的线性变换矩阵（Region Dependent Linear Transform,RDLT）和基于最小音素错误准则均值补偿的特征（mean-offset feature Minimum Phone Error,m-fMPE）变换矩阵,将两者的特征变换矩阵构成过完备的字典;采用强制对齐的方式对语音信号进行分段,以似然度最大化作为目标函数,利用匹配追踪算法对目标函数迭代优化,自动地确定各语音信号段中的变换矩阵及其系数.为保证特征变换的稳定性,在选择变换矩阵过程中引入相关度测量,去除相关的特征基矢量.实验结果表明,相比于传统的RDLT方法,当声学模型分别采用最大似然和区分性准则训练时,识别性能分别可以提高1.63%和2.23%.该方法同时能应用于语音增强和模型区分性训练中. 相似文献

4.

加性噪声条件下鲁棒说话人确认 总被引：1，自引：0，他引：1

下载免费PDF全文

张二华王明合唐振民《电子学报》2019,47(6):1244-1250

基于非负矩阵分解的语音去噪,在提高语音信号信噪比的同时,也会引起语音失真,从而导致噪声环境下说话人确认系统性能下降.本文提出基于分区约束非负矩阵分解的语音去噪方法（Nonnegative Matrix Factorization with Partial Constrains,PCNMF）,目的是在未知和非平稳噪声条件下提高话人确认系统的鲁棒性.PCNMF在满足分区约束条件的基础上分别构建语音字典和噪声字典.考虑到传统语音训练产生的语音字典往往含有一定的噪声成分,PCNMF通过数学模型产生基音及泛音频谱,在此基础上利用该频谱模仿人声的共振峰结构来合成字典,从而保证语音字典纯净性.另一方面,为了克服传统噪声字典构建方法带来的部分噪声信息丢失问题,PCNMF对在线分离出的噪声样本进行分帧和短时傅里叶变换,然后以帧为单位线性组合生成噪声字典.性能评估实验引入了多种噪声类型,实验结果表明PCNMF可有效提高说话人确认系统的鲁棒性,特别是在未知和非平稳噪声条件下其等错率相比基线系统（Multi-Condition）平均降低了5.2%. 相似文献

5.

宽带协方差矩阵的多字典联合稀疏表示DOA估计

何振清刘庆华欧阳缮《信号处理》2012,28(5):686-691

为了直接处理相干宽带信号和提高其波达方向估计的分辨率,提出一种基于宽带协方差矩阵的多字典联合稀疏分解估计方法。首先,利用多个频率点处的过完备基对其协方差矩阵进行稀疏表示,然后形成多个字典的多测量矢量稀疏表示模型,最后通过多字典稀疏表示系数的联合稀疏约束以求解稀疏反问题的形式实现宽带信号的波达方向估计。对于均匀线阵结构,多字典协方差矩阵稀疏表示系数的联合稀疏性使其不再受空域采样条件的限制,既可通过增大阵元间距提高分辨率,而又无空域混叠现象。通过对噪声功率的预估计抑制噪声,提高了波达方向估计的稳健性。另外,该方法与信号协方差矩阵的秩无关,对相干信号和不相干信号都适用。仿真实验验证了该方法的有效性。相似文献

6.

改进的非负矩阵分解语音增强算法

下载免费PDF全文

胡永刚张雄伟邹霞闵刚郑云飞李莉石佳佳《信号处理》2015,31(9):1117-1123

本文提出了一种改进的非负矩阵分解语音增强算法,该算法可分为训练和增强两部分。首先,为了降低训练复杂度,采用卷积非负矩阵分解只提取噪声字典。增强时,考虑语音信号稀疏性比噪声信号稀疏性强,通过稀疏非负矩阵分解重构出语音幅度谱,采用交替方向乘子法进行优化迭代,克服了经典乘性迭代易陷入局部最优、分母只能收敛到零极限等问题。最后,基于算法融合的思想,将重构的语音幅度谱与谱减法、最小均方误差幅度谱估计得到的幅度谱进行加权融合。仿真实验中,在10种不同噪声环境中,通过多种评价标准证明所提算法能取得较好的增强效果。相似文献

7.

基于自适应稀疏表示的电子商务语音识别增强方法研究

下载免费PDF全文

王一海《电子器件》2019,42(2)

传统语音增强算法在去除噪声的同时也导致语音受损，为了减小这种负面影响，结合了语音信号的稀疏表示算法与语音增强算法和自适应的获得训练字典，提出了一种基于自适应稀疏表示的语音增强算法。仿真实验结果表明该方法即使在低信噪比的条件下也能有效去噪，且去噪后能很好的分辨出原始语音信号。相似文献

8.

基于多任务疏表达的二元麦克风小阵列语音增强算法简

杨立春叶敏超钱沄涛《通信学报》2014,35(2):12-94

针对常规二元麦克风小阵列话音增强算法通常需要话音活动检测技术支持,并且难以有效抑制第一帧含目标信号的噪声。提出了一种基于多任务稀疏表达的二元麦克风小阵列话音增强算法,首先利用字典学习方法分别获得目标信号和噪声信号的过完备字典,然后利用混合范数对信号在其字典上的表示系数进行正则化稀疏约束,使得2个阵元接收到信号中的噪声信号被抑制,而话音信号尽量保持不变,从而达到话音增强的目标。仿真和实验数据表明,无论开始位置是否含有目标话音信号,所提出的非话音活动检测支持的二元麦克风小阵列话音增强算法均能有效实现话音增强的目标。相似文献

9.

自训练过完备字典和稀疏表示的语音增强

《现代电子技术》2015,(13)

提出的算法利用带噪信号进行训练以获得过完备字典,通过设定较大的字典训练阈值,训练过程只对语音信号进行,使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示,进而实现语音增强。仿真实验表明,增强后的信号表示系数稀疏度更强,增强效果在信噪比(SNR)和感知语音质量评估(PESQ)得分方面均有较大改进。相似文献

10.

一种基于拟牛顿法的CS投影矩阵优化算法

下载免费PDF全文

郑红李振黄盈《电子学报》2014,42(10):1977-1982

压缩感知(Compressed Sensing,CS)理论中,投影矩阵优化是一类通过提高观测数据信息量而改善性能的方法.由于投影矩阵与稀疏字典内积构造的Gram矩阵必定奇异,基于广义逆矩阵求解方法存在计算精度的问题.本文提出了一种利用拟牛顿法的CS投影矩阵优化算法.该算法分为两步:一是利用阈值函数约束Gram矩阵非对角线元素,使投影矩阵与稀疏字典的互相关系数逼近Welch界;二是采用秩2校正得到Hessian阵逆近似去修正梯度搜索方向.两个步骤交替执行,直到解出符合优化要求的投影矩阵.该算法始终保持下降性,具有超线性收敛速度,避免了矩阵函数二阶导数复杂的计算,计算量较小.实验结果表明,当信号稀疏度或观测数据相同时,本文算法的重构结果优于其他算法. 相似文献

11.

基于多目标联合优化的语音增强方法研究

下载免费PDF全文

谢福仕康迂勇施明月郑能恒《信号处理》2021,37(10):1996-2003

语音增强旨在从受噪声干扰的语音中提取目标语音,目前基于神经网络的语音增强方法在提升语音质量和可懂度方面已被证明是有效的。通过多目标联合优化,利用不同特征之间的互补性,可以提升基于神经网络的语音增强方法的性能。然而,这类多目标学习的语音增强方法在网络优化过程中,通常分别对单个输出目标进行损失函数的计算,多目标之间是并行的,并没有充分利用多目标之间可能存在的关联。为了在网络训练过程中增加输出目标间的关联,本文利用长短时记忆网络构建一种双输出系统框架,设计一种多目标损失函数计算策略用于网络训练。该框架估计出目标语音和噪声,基于此得到估计的带噪语音,然后对这三部分进行联合优化。实验结果表明,所提方法可以提高网络对噪声抑制能力,通过该策略可以获得质量更高,噪声残留更少的增强语音。相似文献

12.

基于帧间相关性的最大后验估计语音增强算法

欧世峰赵晓晖《电子学报》2007,35(10):2007-2013

通过讨论纯净语音分量的概率分布特征以及相邻分量间的统计相关特性,在自适应K-L变换(KLT,Karhunen-Loève Transform)域给出了一种新的语音信号统计模型,然后基于该信号模型,利用最大后验(MAP,Maximum a Posterior)估计理论提出了一种新型的单通道语音增强算法.该算法充分考虑到在KLT域相邻时刻语音分量间存在的相关信息,利用信号的高斯模型假设条件,以联合概率密度函数的形式将这种相关信息融合到MAP中,获得纯净语音分量的估计.算法不仅结构简单利于实现,且有效地避免了传统算法对语音分量估计的不足.仿真结果表明本文算法在客观和主观测试中都具有较好的语音增强效果. 相似文献

13.

基于稀疏性的相位谱补偿语音增强算法

下载免费PDF全文

张天骐张晓艳周琳胡延平《信号处理》2020,36(11):1867-1876

相位谱补偿语音增强算法通过调整相位谱对噪声进行压缩,提高重构信号的质量。针对传统的相位谱补偿(phase spectrum compensation, PSC)语音增强算法采用固定的相位补偿因子,且算法的性能易受噪声估计准确性的影响,提出了一种基于稀疏性的相位谱补偿(sparsity-based phase spectrum compensation, SPSC)语音增强算法。首先,利用噪声估计算法得到噪声幅度谱,利用基于幅度谱的语音增强算法得到目标语音幅度谱;接着,通过噪声和目标语音幅度谱之间的局部信噪比(Signal-to-Noise Ratio, SNR)来估计谱时间稀疏性;然后,利用sigmoid函数改进相位补偿因子,联合补偿因子和谱时间稀疏性,得到SPSC函数。最后,使用SPSC函数对相位谱中的谱分量进行补偿,通过短时傅里叶逆变换得到最终增强后的语音信号。仿真实验表明,在四种不同背景噪声的低信噪比下,新的相位谱补偿算法使增强语音获得了更好的LSD、PESQ和segSNR指标,说明新的算法在低信噪比下,可以有效恢复带噪语音中的语音成分,对噪声抑制效果明显,增强语音的质量和听感均有一定提升。相似文献

14.

一种新的自适应语音增强系统 总被引：4，自引：0，他引：4

胡啸胡爱群赵力《电路与系统学报》2003,8(5):72-75

针对自适应噪声对消(ANC)语音增强系统的性能高度依赖于参考信号的质量，任何原始语音信号泄漏到参考信号中，都会导致原始语音信号失真和噪声抵消性能恶化这一问题，本文提出一种对泄漏不敏感的附加随机噪声(ARN)自适应噪声对消语音增强系统。它通过在参考信号中加入一个低功率的宽带随机训练信号，然后用该训练信号作参考信号对噪声传输函数(NTF)进行自适应建模，并在使用自适应预测滤波器(APF)消除NTF自适应建模的语音信号干扰的同时，用补偿滤波器(CPF)来修正由APF引起的参考信号失真。计算机仿真表明，这种ARNANC语音增强系统在泄漏情况下能将原始语音信号从带噪语音信号中有效分离出来。相似文献

15.

在线更新噪声基矩阵的非负矩阵分解语音增强方法

下载免费PDF全文

白志刚鲍长春《信号处理》2020,36(6):831-838

基于非负矩阵分解(Nonnegative matrix factorization, NMF)的语音增强算法需要和背景噪声类型匹配的噪声基矩阵(Basis matrix)，而在实际中，这是很难被保证的。本文提出了一种基于噪声基矩阵在线更新的非负矩阵分解语音增强方法，该方法首先利用一个无语音帧判决模块识别出带噪语音的无语音区域，然后利用一个固定长度的滑动窗口(Sliding window)来包含若干帧最近过去的带噪语音的无语音帧，并用这些无语音帧的幅度谱在线更新噪声基矩阵，最后利用更新得到的噪声基矩阵和预先训练的语音基矩阵实现语音增强。该方法能够在线更新出匹配的噪声基矩阵，有效地解决了噪声基矩阵不匹配的问题。实验证明，本文所提的方法在线学习到的噪声基矩阵在大多数条件下比匹配训练集下训练得到的噪声基矩阵的性能还要优越。相似文献

16.

采用子带长时信号变化特征的稳健语音活动检测

蔡铁唐飞龙志军《电视技术》2014,38(19)

为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率. 相似文献

17.

基于联合时空图拓扑结构的多通道语音MVDR增强算法

下载免费PDF全文

杨洋郭海燕王婷婷张鹏程杨震《信号处理》2023,39(3):540-549

本文研究图频域内的多通道语音增强,利用图信号处理理论（GSP）构建一种时间-空间维度的联合图拓扑结构,在此基础上设计增强算法进行多通道语音消噪。具体而言,基于输入阵列某个麦克风输入帧间语音顶点信号的时间相关关系,构造时间维度上的一种图拓扑结构;同时针对多通道含噪语音,根据各通道接收信号的空间相关关系,构造空间维度上的一种图拓扑结构。基于时间和空间二种图拓扑构成的联合图拓扑结构,采用图频域内的最小方差无失真响应（MVDR）增强算法,进行多通道语音增强。仿真实验结果表明,在平均客观语音质量评估（PESQ）得分和平均拓展短时客观可懂度（ESTOI）评价指标下,本文所提出的基于联合图拓扑结构的MVDR波束形成（JG-MVDR）方法都优于常规图MVDR波束形成（GMVDR）方法和基于复高斯混合模型的MVDR波束形成（CGMM-MVDR）方法。相似文献

18.

骨导气导结合的语音增强算法

满娟吴鸣杨军《电声技术》2011,35(6):42-46

通过对骨导气导信号的对比和研究,提出了一种骨导气导结合的语音增强算法.它充分利用了骨导信号屏蔽环境噪声的高信噪比特性,将骨导信息以概率模式引入到改进后的维纳滤波算法中,并针对高噪声环境下语音信息被噪声严重破坏的情况,将骨导信号通过能量对比得到的权系数修正替换到原气导信号,实现了较好的语音增强效果. 相似文献