首页 | 本学科首页   官方微博 | 高级检索  
     

面向多说话人分离的深度学习麦克风阵列语音增强
引用本文:张家扬,童峰,陈东升,黄惠祥. 面向多说话人分离的深度学习麦克风阵列语音增强[J]. 电子技术应用, 2022, 48(5): 31-36. DOI: 10.16157/j.issn.0258-7998.212404
作者姓名:张家扬  童峰  陈东升  黄惠祥
作者单位:厦门大学水声通信与海洋信息技术教育部重点实验室,福建厦门361005;厦门大学海洋与地球学院,福建厦门361005,厦门大学水声通信与海洋信息技术教育部重点实验室,福建厦门361005;厦门大学海洋与地球学院,福建厦门361005;厦门大学深圳研究院,广东深圳518000
基金项目:国家自然科学基金项目(11274259);
摘    要:随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一。与环境噪声不同,多说话人分离场景下干扰说话人语音与目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战。针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果。仿真和实验结果表明,该方法有效提高了多说话人分离性能。

关 键 词:深度学习  麦克风阵列  波束形成  LSTM

Deep learning microphone array speech enhancement for multiple speaker separation
Zhang Jiayang,Tong Feng,Chen Dongsheng,Huang Huixiang. Deep learning microphone array speech enhancement for multiple speaker separation[J]. Application of Electronic Technique, 2022, 48(5): 31-36. DOI: 10.16157/j.issn.0258-7998.212404
Authors:Zhang Jiayang  Tong Feng  Chen Dongsheng  Huang Huixiang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号