首页 | 本学科首页   官方微博 | 高级检索  
     

N-DenseNet的城市声音事件分类模型
作者姓名:曹毅  黄子龙  张威  刘晨  李巍
作者单位:1. 江南大学机械工程学院,江苏 无锡 2141222. 江苏省食品先进制造装备技术重点实验室,江苏 无锡 2141223. 苏州工业职业技术学院,江苏 苏州 215104
基金项目:江苏省“六大人才高峰”计划(ZBZZ-012);高等学校学科创新引智计划(B18027);江苏省研究生创新计划(KYCX18_0630);江苏省研究生创新计划(KYCX18_1846);江南大学研究生科研与实践创新计划(JNKY19_048);江南大学研究生科研与实践创新计划(JNSJ19_005)
摘    要:针对城市声音事件分类领域中现有模型分类准确率不高、泛化能力不强的问题,提出了一种N阶密集卷积神经网络的城市声音事件分类模型。首先,介绍了密集卷积神经网络的结构;其次,基于N阶马尔可夫模型将密集连接改进为N阶有关连接;然后,结合两者提出了一种更适合音频分类的模型——N阶密集卷积神经网络。该模型在避免梯度消失的前提下, 有针对性、规律性减少了特征图层之间的连接,更高效地融合了前N特征图层的信息,使得模型的收敛速度更快;最后,为了验证该模型,采用N阶密集卷积神经网络的一阶、二阶子模型,基于UrbanSound8K和Dcase2016数据集开展了城市声音事件分类研究。研究结果表明,其模型准确率分别为83.63%、81.03%,验证了该模型具有良好的分类准确率和泛化能力。

关 键 词:声音事件分类  密集卷积神经网络  N阶马尔可夫模型  N阶密集卷积神经网络  
收稿时间:2019-05-15
点击此处可从《西安电子科技大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《西安电子科技大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号