用于声音事件定位与检测的空间信息增强方法 |
| |
引用本文: | 肖剑,郭海燕,王婷婷,等. 用于声音事件定位与检测的空间信息增强方法[J]. 信号处理,2024,40(12): 2206-2218. DOI: 10.12466/xhcl.2024.12.009. |
| |
作者姓名: | 肖剑 郭海燕 王婷婷 杨震 |
| |
作者单位: | 1.南京邮电大学通信与信息工程学院,江苏 南京 210003;2.南京邮电大学通信与网络技术国家地方联合工程研究中心,江苏 南京 210003 |
| |
基金项目: | 国家自然科学基金(62071242) |
| |
摘 要: |  声音事件定位与检测包含到达方向估计和声音事件检测两个子任务。作为当前声音事件定位与检测领域中应用最为广泛的模型之一,卷积循环神经网络模型采用卷积神经网络分别从单个音频通道中提取特征,这导致模型丢失了不同通道间的相关信息。然而,通道间的相关信息蕴含了与声源位置相关的空间线索,空间信息的缺失必然会影响模型的到达方向估计性能。此外,卷积循环神经网络模型中使用的交叉熵损失函数还会引起特征分散问题。 为解决这些问题,本文提出采用混合损失函数的图卷积循环神经网络模型。具体地,采用图卷积神经网络对不同特征通道间的信息进行聚合,以获取包含更丰富空间信息的特征,来改进卷积循环神经网络模型的到达方向估计性能。在此基础上,结合交叉熵损失函数和角度间隔softmax函数,提出一种新的混合损失函数来解决特征分散问题提高模型的分类性能。实验结果表明,本文提出的采用混合损失函数的图卷积循环神经网络模型在定位相关声音事件检测错误率、F1分数、定位召回率和声音事件定位与检测得分方面均优于其他声音事件定位与检测模型。

|
关 键 词: | :声音事件定位与检测 深度学习 图卷积网络 多通道 |
收稿时间: | 2023-09-04 |
|
| 点击此处可从《信号处理》浏览原始摘要信息 |
|
点击此处可从《信号处理》下载全文 |
|