首页 | 本学科首页   官方微博 | 高级检索  
     

基于元学习的半监督声音事件检测方法
作者姓名:沈雅馨  高利剑  毛启容
作者单位:1.江苏大学计算机科学与通信工程学院;2.江苏省大数据泛在感知与智能农业应用工程研究中心
基金项目:国家自然科学基金 62176106;江苏省研究生科研与实践创新计划项目 KYCX22_3668;江苏大学应急管理学院专项科研项目 KY-A-01 ~~;
摘    要:现有的半监督声音事件检测方法直接使用强标签合成样本、弱标签真实样本和无标签真实样本进行训练,以缓解标签样本量不足的问题。然而,合成和真实数据域之间存在不可避免的分布差异,这种差异会干扰模型梯度优化方向,从而限制模型的泛化能力。针对这一问题,基于元学习(Meta Learning)提出了一种新颖的半监督声音事件检测学习范式MMT(Meta Mean Teacher)。具体来说,对于每个训练批次的数据,将其分为由合成样本组成的元训练集和由真实样本组成的元测试集;将模型在元训练集上计算的元梯度作为元测试梯度更新的指导,使模型感知并学习到更具泛化性的知识。在DCASE2021任务4数据集的测试集上进行对比实验,结果表明,相较于官方基线,所提出的学习范式MMT在F1,PSDS1和PSDS2指标上分别提升了8.9%,6.6%和1.1%;相较于当前的先进方法,所提出的学习范式MMT同样表现出了显著的性能优势。

关 键 词:声音事件检测  元学习  一致性正则化  半监督学习  深度学习  
收稿时间:2024-01-29
修稿时间:2024-05-23
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号