首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度残差注意力的图像事件描述
引用本文:张欣怡,李永刚,季兴隆,孙红莲.基于深度残差注意力的图像事件描述[J].数字社区&智能家居,2021(5).
作者姓名:张欣怡  李永刚  季兴隆  孙红莲
作者单位:嘉兴学院数理与信息工程学院
基金项目:浙江省自然科学基金项目(LY19F020017);嘉兴市级公益性研究计划项目(2020AY10024);国家级大学生创新创业训练计划项目(201910354024);嘉兴学院重点SRT项目资助。
摘    要:图像事件描述是根据图像特征数据再结合自然语言处理技术,输出图像事件的语句描述的技术。图像事件的描述,对图片分类、查询等有着极高效率,为了达到更精确的描述效果,本文提出基于深度残差注意力的图像事件描述方法。该方法以ResNet的网络结构为基础,联合分离出的全局注意力与局部注意力,关注图像事件中心事件,生成图像事件描述。在COCO数据集上的实验表明,本文提出的方法能更好关注事件发生区域,对抽象事件描述更为准确。

关 键 词:图像事件描述  深度学习  注意力机制
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号