弱标签声音事件检测的空间-通道特征表征与自注意池化 |
| |
引用本文: | 杨利平,侯振威,辜小花,郝峻永.弱标签声音事件检测的空间-通道特征表征与自注意池化[J].电子学报,2023(2):297-306. |
| |
作者姓名: | 杨利平 侯振威 辜小花 郝峻永 |
| |
作者单位: | 1. 重庆大学光电技术及系统教育部重点实验室;2. 重庆科技学院电气工程学院 |
| |
基金项目: | 国家自然科学基金(No.61903054)~~; |
| |
摘 要: | 深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法 .该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法 .实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声...
|
关 键 词: | 特征表征 自注意池化 卷积循环神经网络 弱标签学习 声音事件检测 |
|