首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
提出一种基于声源时延估计的二元时频掩蔽方法.通过三个接收信号实现多于多个语音源信号的欠定盲分离.利用语音信号的W-分离正交性,在时频域估计各个源信号到达接收阵列的相对时延序列;进而基于信号时延序列的估计,采用最大似然算法将时频域划分为与源信号个数相同的互不重叠的时频点集合,每个集合(近似)只包含一个源信号的所有时频分量;再通过二元时频掩蔽依次恢复出各集合所对应的源信号.该方法性能通过主观试听得到了验证,其分段信噪比增益至少为13 dB.较之欠定解混迭估计技术DUET,本文方法得到的分离信号与实际声源信号的相异度降低约3 dB.  相似文献   

2.
针对语音信号的欠定卷积混合模型,提出一种基于快速独立分量分析和自适应非线性二元时频掩蔽的语音盲分离方法。对输入的混合语音信号进行快速独立分量分析,将结果进行自适应非线性二元时频掩蔽;重复进行这两步处理,直到分离出所有的语音源信号。将分离出的语音源信号,再通过二元时频掩蔽合并可提高输出的质量,分离出的语音信号仍然能保留双声道立体声的效果。实验表明,该方法的性能大大优于DUET方法和BLUES方法,信噪比增益大幅提高。  相似文献   

3.
近年来,随着深度学习的发展,深层模型被越来越多的学者用于语音分离.其中,以深度神经网络(Deep Neural Networks,DNN)为代表的深度学习在语音分离领域表现出了强大的优势.为了更好的提高目标语音的质量,我们提出一种基于组合DNN的语音分离方法(CE_DNN).首先把两种不同的训练集放入DNN中进行训练,得到了两种不同参数的DNN训练模型,然后将测试数据放入两种训练模型后得到的输出结果进行结合,并且将不同类型的噪声与纯净语音进行混合,再配以噪声的不同输入信噪比进行试验.实验结果表明,与DNN语音分离系统相比,CE_DNN不仅可以很好的提高理想二值掩蔽(IBM)中的HIT-FA指标(命中率-误报率),还可以提高语音目标的短时客观语音可懂度(STOI).  相似文献   

4.
差分麦克风阵列为实现小尺寸阵列条件下的声源定位提供了一条重要技术途径。语音信号具有稀疏性,利用该特性可实现基于差分麦克风阵列的多声源方位估计,其中的典型方法为直方图法。针对差分麦克风阵列,本文提出了一种基于时频掩蔽和模糊聚类分析的短时平均复声强多声源方位估计方法。分析了不同阵列尺寸条件下时频掩蔽频带范围的选择问题。该方法具有闭式解,在强混响噪声环境下的性能优于直方图法,并且受阵列尺寸变化的影响较小。为了改善直方图法的性能, 基于时频掩蔽的思想,文中还给出了一种修正的直方图方法。混响噪声环境下的仿真实验结果验证了本文所提方法的有效性。  相似文献   

5.
非负矩阵部分联合分解(Nonnegative matrix partial co-factorization, NMPCF)将指定源频谱作为边信息参与混合信号频谱的联合分解, 以帮助确定指定源的基向量进而提高信号分离性能.卷积非负矩阵分解(Convolutive nonnegative matrix factorization, CNMF)采用卷积基分解的方法进行矩阵分解, 在单声道语音分离方面取得较好的效果.为了实现强噪声条件下的语音分离, 本文结合以上两种算法的优势, 提出一种基于卷积非负矩阵部分联合分解(Convolutive nonnegative partial matrix co-factorization, CNMPCF)的单声道语音分离算法.本算法首先通过基音检测算法得到混合信号的语音起始点, 再据此确定混合信号中的纯噪声段, 最后将混合信号频谱和噪声频谱进行卷积非负矩阵部分联合分解, 得到语音基矩阵, 进而得到分离的语音频谱和时域信号.实验中, 混合语音信噪比(Signal noise ratio, SNR)选择以-3 dB为间隔从0 dB至-12 dB共5种SNR.实验结果表明, 在不同噪声类型和噪声强度条件下, 本文提出的CNMPCF方法相比于以上两种方法均有不同程度的提高.  相似文献   

6.
目前解决语音信号盲源分离(Blind source separation,BSS)的两大类方法分别为频域独立成分分析(Frequency domain independent component analysis,FDICA)和基于稀疏性的时频掩蔽(Time frequency masking,TF masking).为此将两类方法优点相结合,利用TF masking方法的结果,对FDICA做初始化,在加快FDICA收敛速度的同时也避免了次序不确定性问题.此外还提出了一种新的基于语音稀疏性FDICA的BSS后处理方法:基于局部最小比例控制(Local minimum ratio controlled,LMRC)谱减法,比常规的TF masking、维纳滤波等后处理方法,能够更有效地控制音乐噪声,提高分离性能.合成数据和实际采集数据的实验结果验证了所提方法的有效性.  相似文献   

7.
摘要:针对说话人语音提取问题,提出了一种基于深度神经网络多任务学习的嵌入式注意机制单声道说话人语音提取方法。该算法将语音分离和语音提取统一到单个框架中,向频谱映射分离模型中嵌入说话人注意机制,并在引入说话人辅助信息的注意机制中得到时变注意权重,利用时变注意权重分离出目标说话人的内部嵌入向量,随后采用提取模型对目标说话人的嵌入向量进行非线性处理运算,估计出目标说话人对应的掩蔽,进而提取出目标说话人语音。同时借助TIMIT数据集,进行了语音提取实验。实验结果验证了所提算法的可行性和有效性,并在说话人语音提取的性能上有明显的优越性。  相似文献   

8.
针对单信道中时频重叠双信号的载波频率估计问题,提出一种基于二阶循环累积量的载波频率估计方法。该方法通过检测信号二阶循环累积量的峰值进行载波频率估计,不需要对信号进行分离,可以直接估计双信号的载波频率。仿真结果表明,对于BPSK、QPSK、8QAM、16QAM任意组合的时频重叠双信号,在信噪比不低于-5 dB的情况下,该方法的载波频率估计准确率高于95%。  相似文献   

9.
语音端点检测对于构建实际语音识别系统具有重要的意义。为了提升在低信噪比条件下语音端点检测算法的性能,提出一种基于最大熵谱和时频特性的端点检测算法。对分帧后的语音信号通过最大熵估算出功率谱,并根据带噪语音信号时频域上的特性进行特征捕捉,从而进行端点检测。实验结果表明,此方法在较低的信噪比下(-9~0 dB)能够比较准确地捕捉语音信号的特征,明显地提高了端点检测的准确性。  相似文献   

10.
解卷积混合语音频域盲分离的次序问题新方法   总被引:1,自引:0,他引:1  
多通道语音信号的混合往往是卷积混合,瞬时盲分离方法不能获得好的分离效果,而频域方法由于频率次序的问题使性能下降.本文采用时频掩模的方法得到各频点上具有确定次序的、但带有失真的分离信号,将其作为参考,与频域上解得的次序不定信号进行相关,从而获得精确的语音分离信号.实验表明:本文提出的方法能有效地解决频域盲分离的次序不确定性问题,得到精度更高的分离卷积混舍的语音信号.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号