首页 | 本学科首页   官方微博 | 高级检索  
     

基于时空建模的视频帧预测模型
作者姓名:李森  许宏科
作者单位:长安大学
基金项目:国家自然科学基金:基于高阶上下文建构学习的多源异质视频异常检测(61603057)。
摘    要:视频帧预测是计算机视觉领域一个重要的研究领域,并且拥有广泛的应用。目前,常用的视频帧预测模型虽然取得了一定的效果,但由于这类模型并不能在时空信息上同时建模,因此难以在更加复杂度的现实场景下应用。针对此问题,文中提出一种深度时空建模神经络。该网络通过预测未来光流,并利用该光流对前一帧图像进行采用的方法来预测未来图像,此外分别加入卷积LSTM与自注意力机制进行时空信息的建模。文章在Caltech行人数据集上进行了充分的实验,并取得了较好的实验结果。

关 键 词:视频帧  深度学习  光流预测  自注意力机制  深度时空建模  计算机视觉
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号