多尺度输入3D卷积融合双流模型的行为识别方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

多尺度输入3D卷积融合双流模型的行为识别方法

引用本文：	宋立飞, 翁理国, 汪凌峰, 夏旻. 多尺度输入3D卷积融合双流模型的行为识别方法[J]. 计算机辅助设计与图形学学报, 2018, 30(11): 2074-2083. DOI: 10.3724/SP.J.1089.2018.17068

作者姓名：	宋立飞翁理国汪凌峰夏旻

基金项目：	国家自然科学基金(61503192; 61773377); 江苏省自然科学基金(BK20161533)

摘要：	基于视频的行为识别技术在计算机视觉领域有广泛的应用.针对当前存在的网络模型不能有效结合视频数据中的时空信息,并且缺乏对不同尺度数据之间的融合信息进行考虑等问题,提出一种结合双流网络以及3D卷积神经网络的多尺度输入3D卷积融合双流模型.首先利用2D残差网以及多尺度输入3D卷积融合网络获取视频中的时空维度信息;然后将2层网络得到的实验结果进行决策相加,有效地提升网络对视频中时空特征提取的能力;最后通过在多尺度输入3D卷积融合网络对不同尺度的数据进行不同策略的融合,提高了网络对不同尺度数据的泛化能力.实验结果表明,文中模型在数据集UCF-101以及HMDB-51的识别准确率分别为90.5%与66.3%;相比于其他方法,该模型能取得更高的识别精度,体现出文中方法的优越性与鲁棒性.
关键词：	行为识别 3D卷积深度学习多尺度输入信息融合
收稿时间：	2017-12-28
本文献已被 CNKI 等数据库收录！
	点击此处可从《计算机辅助设计与图形学学报》浏览原始摘要信息
	点击此处可从《计算机辅助设计与图形学学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏