首页 | 本学科首页   官方微博 | 高级检索  
     

基于联合学习框架的音频场景聚类
引用本文:张聿晗,李艳雄,江钟杰,陈昊.基于联合学习框架的音频场景聚类[J].电子学报,2021,49(10):2041-2047.
作者姓名:张聿晗  李艳雄  江钟杰  陈昊
作者单位:华南理工大学电子与信息学院,广东广州510640
摘    要:音频场景聚类的任务是将属于相同音频场景的音频样本合并到同一个类中.本文提出一种基于联合学习框架的音频场景聚类方法.该框架由一个卷积自编码网络(Convolution Autoencoder Network,CAN)与一个判别性聚类网络(Discriminative Clustering Network,DCN)组成.CAN包括编码器和译码器,用于提取深度变换特征,DCN用于对输入的深度变换特征进行类别估计从而实现音频场景聚类.采用DCASE-2017和LITIS-Rouen数据集作为实验数据,比较不同特征与聚类方法的性能.实验结果表明:采用归一化互信息和聚类精度作为评价指标时,基于联合学习框架提取的深度变换特征优于其他特征,本文方法优于其他方法.本文方法所需要付出的代价是需要较大的计算复杂度.

关 键 词:音频场景聚类  联合学习框架  卷积自编码网络  判别性聚类网络

Audio Scene Clustering Based on Joint Learning Framework
ZHANG Yu-han,LI Yan-xiong,JIANG Zhong-jie,CHEN Hao.Audio Scene Clustering Based on Joint Learning Framework[J].Acta Electronica Sinica,2021,49(10):2041-2047.
Authors:ZHANG Yu-han  LI Yan-xiong  JIANG Zhong-jie  CHEN Hao
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号