基于联合学习框架的音频场景聚类 Audio Scene Clustering Based on Joint Learning Framework期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于联合学习框架的音频场景聚类

引用本文：	张聿晗,李艳雄,江钟杰,陈昊.基于联合学习框架的音频场景聚类[J].电子学报,2021,49(10):2041-2047.

作者姓名：	张聿晗李艳雄江钟杰陈昊

作者单位：	华南理工大学电子与信息学院,广东广州510640

摘要：	音频场景聚类的任务是将属于相同音频场景的音频样本合并到同一个类中.本文提出一种基于联合学习框架的音频场景聚类方法.该框架由一个卷积自编码网络(Convolution Autoencoder Network,CAN)与一个判别性聚类网络(Discriminative Clustering Network,DCN)组成.CAN包括编码器和译码器,用于提取深度变换特征,DCN用于对输入的深度变换特征进行类别估计从而实现音频场景聚类.采用DCASE-2017和LITIS-Rouen数据集作为实验数据,比较不同特征与聚类方法的性能.实验结果表明:采用归一化互信息和聚类精度作为评价指标时,基于联合学习框架提取的深度变换特征优于其他特征,本文方法优于其他方法.本文方法所需要付出的代价是需要较大的计算复杂度.
关键词：	音频场景聚类联合学习框架卷积自编码网络判别性聚类网络
Audio Scene Clustering Based on Joint Learning Framework

ZHANG Yu-han,LI Yan-xiong,JIANG Zhong-jie,CHEN Hao.Audio Scene Clustering Based on Joint Learning Framework[J].Acta Electronica Sinica,2021,49(10):2041-2047.

Authors:	ZHANG Yu-han LI Yan-xiong JIANG Zhong-jie CHEN Hao

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏