基于增强全局-局部特征融合的视频描述生成方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于增强全局-局部特征融合的视频描述生成方法

引用本文：	黄飞燕,曾上游,邱泓语.基于增强全局-局部特征融合的视频描述生成方法[J].国外电子测量技术,2024,43(1):1-9.

作者姓名：	黄飞燕曾上游邱泓语

作者单位：	广西师范大学电子与信息工程学院/集成电路学院

基金项目：	国家自然科学基金(61976063)项目资助；

摘要：	现有的视频描述生成方法提取的特征及特征组合的方式较为简单，导致模型丢失了部分与视频描述相关的重要语义信息，限制了对视频内容的准确描述和理解。分析存在的不足，提出了一种基于增强全局-局部特征融合的视频描述生成方法。首先采用不同特征提取器分别对视频片段提取局部特征和全局特征，为了建模不同级别特征(局部和全局)的相关性，利用特征融合增强网络进行特征融合，丰富模型的特征信息。解码器使用的双向长短期记忆网络，并在其后加入重构网络，重构经编码器处理得到的视频特征序列，最终经过长短期记忆网络生成视频的描述语句。在MSVD与MSR-VTT数据集上的实验结果表明，提出的模型可以显著提高生成的描述语句的准确性。
关键词：	视频描述生成增强特征融合网络自然语言处理

	点击此处可从《国外电子测量技术》浏览原始摘要信息
	点击此处可从《国外电子测量技术》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏