一种基于改进RT-MDNet的全景视频目标跟踪算法 |
| |
作者姓名: | 王殿伟 方浩宇 刘颖 伍世虔 谢永军 宋海军 |
| |
作者单位: | 西安邮电大学 通信与信息工程学院,西安710121,西安邮电大学 通信与信息工程学院,西安710121,西安邮电大学 通信与信息工程学院,西安710121,武汉科技大学 信息科学与工程学院,武汉430081,中国科学院 西安光学精密机械研究所,西安710119,中国科学院 西安光学精密机械研究所,西安710119 |
| |
基金项目: | 公安部科技强警基础研究专项项目(2019GABJC42);陕西省自然科学基础研究计划(创新创业 “双导师”)研究项目(2018JM6118);西安邮电大学研究生创新基金(CXJJLY2018033) |
| |
摘 要: | 为了解决全景视频目标跟踪过程中,由于光照条件变化、相似背景干扰、目标运动时产生的形变和尺度变化等因素的影响,在跟踪中会出现目标漂移、目标丢失等情况,进而导致目标跟踪算法成功率低,鲁棒性差等问题,提出一种基于长短期记忆网络和改进Real-Time MDNet网络的全景视频目标跟踪方法.算法首先采用浅层卷积神经网络提取特征,并利用自适应的RoIAlign减少特征提取过程中的像素损耗,而后运用目标特征在线更新最后一个全连接层的权重,在全连接层中实现前景背景分离并提取出目标区域,然后通过长短期记忆网络自适应地选取目标框的尺度,最终输出目标位置信息.实验结果表明:单目算法应用在全景数据集时,难以适应全景中的尺度变化和背景变化,改进算法利用3层长短期记忆网络构建的尺度预测模块,可以有效地应对全景数据存在的尺度变化和目标形变问题,在保持较好的跟踪精度的同时,可以有效地应对目标跟踪中出现的小目标、目标遮挡、多目标交叉运动的情况,获得更好的视觉效果和更高的重叠率得分.
|
关 键 词: | 目标跟踪 深度学习 全景视频 长短期记忆网络 RT-MDNet |
收稿时间: | 2019-10-25 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《哈尔滨工业大学学报》浏览原始摘要信息 |
|
点击此处可从《哈尔滨工业大学学报》下载全文 |
|