基于多模态信息的视频描述算法 Multimodal information algorithms for video captioning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于多模态信息的视频描述算法

作者单位：	;1.中国科学技术大学信息科学技术学院

摘要：	为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和高级语义属性。在编码器阶段,提取视频的静态特征、光流特征和视频段特征,同时设计语义属性检测网络得到视频高级语义特征。为了避免解码器阶段的曝光偏差和训练损失与评价准则不统一的问题,采用基于强化学习的训练算法直接将客观评价准则作为优化目标来训练模型。所提出的算法在公开视频描述数据集MSVD上取得了很好的实验效果。
关键词：	视频描述多模态信息语义属性强化学习
Multimodal information algorithms for video captioning

Abstract:

Keywords: