基于深度学习的双耳声源定位算法研究 |
| |
作者姓名: | 宋昊 刘雪洁 俞胜锋 钟小丽 |
| |
作者单位: | 广东工业大学管理学院, 广东广州 510000;华南师范大学物理与电信工程学院, 广东广州 510006;华南理工大学物理与光电学院, 广东广州 510640 |
| |
基金项目: | 广东省自然科学基金项目(2021A1515011871,2021A1515012630) |
| |
摘 要: | 针对多种定位因素存在复杂关联且不易准确提取的问题,提出了以完整双耳声信号作为输入的、基于深度学习的双耳声源定位算法。首先,分别采用深层全连接后向传播神经网络(Deep Back Propagation Neural Network,D-BPNN)和卷积神经网络(Convolutional Neural Network, CNN)实现深度学习框架;然后,分别以水平面 15°、30°和 45°空间角度间隔的双耳声信号进行模型训练;最后,采用前后混乱率、定位准确率与训练时长等指标进行算法有效性分析。模型预测结果表明,CNN模型的前后混乱率远低于 D-BPNN;D-BPNN模型的定位准确率能够达到87%以上,而 CNN模型的定位准确率能够达到 98%左右;在相同实验条件下,CNN模型的训练时长大于 D-BPNN,且随着水平面角度间隔的减小,两者训练时长之间的差异愈发显著。
|
关 键 词: | 双耳声源定位 深度学习 卷积神经网络 |
收稿时间: | 2021-03-01 |
修稿时间: | 2021-05-04 |
|
| 点击此处可从《声学技术》浏览原始摘要信息 |
|
点击此处可从《声学技术》下载免费的PDF全文 |
|