面向多说话人分离的深度学习麦克风阵列语音增强 Deep learning microphone array speech enhancement for multiple speaker separation期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向多说话人分离的深度学习麦克风阵列语音增强

引用本文：	张家扬,童峰,陈东升,黄惠祥. 面向多说话人分离的深度学习麦克风阵列语音增强[J]. 电子技术应用, 2022, 48(5): 31-36. DOI: 10.16157/j.issn.0258-7998.212404

作者姓名：	张家扬童峰陈东升黄惠祥

作者单位：	厦门大学水声通信与海洋信息技术教育部重点实验室,福建厦门361005;厦门大学海洋与地球学院,福建厦门361005,厦门大学水声通信与海洋信息技术教育部重点实验室,福建厦门361005;厦门大学海洋与地球学院,福建厦门361005;厦门大学深圳研究院,广东深圳518000

基金项目：	国家自然科学基金项目(11274259)；

摘要：	随着近年来人机语音交互场景不断增加，利用麦克风阵列语音增强提高语音质量成为研究热点之一。与环境噪声不同，多说话人分离场景下干扰说话人语音与目标说话人同为语音信号，呈现类似的时、频特性，对传统麦克风阵列语音增强技术提出更高的挑战。针对多说话人分离场景，基于深度学习网络构建麦阵空间响应代价函数并进行优化，通过深度学习模型训练设计麦克风阵列期望空间传输特性，从而通过改善波束指向性能提高分离效果。仿真和实验结果表明，该方法有效提高了多说话人分离性能。
关键词：	深度学习麦克风阵列波束形成 LSTM
Deep learning microphone array speech enhancement for multiple speaker separation

Zhang Jiayang,Tong Feng,Chen Dongsheng,Huang Huixiang. Deep learning microphone array speech enhancement for multiple speaker separation[J]. Application of Electronic Technique, 2022, 48(5): 31-36. DOI: 10.16157/j.issn.0258-7998.212404

Authors:	Zhang Jiayang Tong Feng Chen Dongsheng Huang Huixiang

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏