基于生成对抗网络的语音信号分离 |
| |
引用本文: | 刘航,李扬,袁浩期,王俊影.基于生成对抗网络的语音信号分离[J].计算机工程,2020,46(1):302-308. |
| |
作者姓名: | 刘航 李扬 袁浩期 王俊影 |
| |
作者单位: | 广东工业大学 机电工程学院,广州 510006;广东工业大学 机电工程学院,广州 510006;广东工业大学 机电工程学院,广州 510006;广东工业大学 机电工程学院,广州 510006 |
| |
基金项目: | 广东省科技计划;佛山市产学研专项 |
| |
摘 要: | 基于深度学习的单声道语音分离需要计算时频掩蔽,但现有语音分离方法中时频掩蔽不可学习,也未将其封装到深度学习中进行优化,通常依赖于维纳滤波法进行后续处理。为此,提出一种基于生成对抗网络的语音信号分离方法。在语音生成阶段引入递归推导算法和稀疏编码器来改进时频掩蔽生成结果,并将生成的语音输入至判别器进行分类,以降低信号源之间的扰动。实验结果表明,与基于深度神经网络的语音信号分离方法相比,该方法的SDR、SIR分离指标分别提高6.2 dB和5.0 dB。
|
关 键 词: | 单声道语音分离 生成对抗网络 时频掩蔽 递归推导 稀疏编码器 |
Speech Signal Separation Based on Generative Adversarial Networks |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|