基于元学习的半监督声音事件检测方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于元学习的半监督声音事件检测方法

作者姓名：	沈雅馨高利剑毛启容

作者单位：	1.江苏大学计算机科学与通信工程学院;2.江苏省大数据泛在感知与智能农业应用工程研究中心

基金项目：	国家自然科学基金 62176106;江苏省研究生科研与实践创新计划项目 KYCX22_3668;江苏大学应急管理学院专项科研项目 KY-A-01 ~~;

摘要：	现有的半监督声音事件检测方法直接使用强标签合成样本、弱标签真实样本和无标签真实样本进行训练,以缓解标签样本量不足的问题。然而,合成和真实数据域之间存在不可避免的分布差异,这种差异会干扰模型梯度优化方向,从而限制模型的泛化能力。针对这一问题,基于元学习(Meta Learning)提出了一种新颖的半监督声音事件检测学习范式MMT(Meta Mean Teacher)。具体来说,对于每个训练批次的数据,将其分为由合成样本组成的元训练集和由真实样本组成的元测试集;将模型在元训练集上计算的元梯度作为元测试梯度更新的指导,使模型感知并学习到更具泛化性的知识。在DCASE2021任务4数据集的测试集上进行对比实验,结果表明,相较于官方基线,所提出的学习范式MMT在F1,PSDS1和PSDS2指标上分别提升了8.9%,6.6%和1.1%;相较于当前的先进方法,所提出的学习范式MMT同样表现出了显著的性能优势。
关键词：	声音事件检测元学习一致性正则化半监督学习深度学习
收稿时间：	2024-01-29
修稿时间：	2024-05-23

	点击此处可从《计算机科学》浏览原始摘要信息
	点击此处可从《计算机科学》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏