排序方式: 共有5条查询结果,搜索用时 15 毫秒
1
1.
2.
本文针对已有视频描述方法中提取的特征难以捕获视频中对象之间的相互联系,以及解码过程中难以充分利用特征重构视频信息的现状,提出一种结合消息传递网络和分层解码器的视频描述系统。首先,利用卷积神经网络和对象检测器提取视频的二维特征、三维特征以及对象特征;然后,使用消息传递网络来更新对象特征,添加对象之间的联系信息;接着,利用时空注意力模块将所有特征进行融合得到视频整体特征;最后,利用分层解码器解码整体特征来获得视频的描述。实验结果显示,该系统能够准确生成对视频内容的描述,并且生成的描述更能体现出对象之间的联系。 相似文献
4.
5.
1