一种基于目标检测与词性分析的图像描述算法 |
| |
引用本文: | 高逸凡,王勇.一种基于目标检测与词性分析的图像描述算法[J].计算机与现代化,2021,0(3):108-114. |
| |
作者姓名: | 高逸凡 王勇 |
| |
作者单位: | 北京工业大学信息学部,北京 100124;北京工业大学信息学部,北京 100124 |
| |
摘 要: | 针对现有的基于注意力机制的图像描述方法描述内容与图像关联度低的问题,提出一种基于目标检测与词性分析的图像描述算法。该方法在注意力机制的基础上,通过目标检测算法提取图片中的信息,使用带有注意力机制的循环神经网络对提取到的信息进行处理,生成图像描述语句。在生成单词的过程中,算法会预测每个单词的词性,根据不同的词性选择不同的神经网络,从而提升描述语句与原图像的关联度。实验结果表明,在多种客观描述评价标准中,本文算法生成的描述语句相对目前存在的算法均有不同程度提升,同时,在主观评价中也能够更准确流畅地描述图片的内容。
|
关 键 词: | 图像描述 循环神经网络 注意力机制 目标检测 深度学习 自然语言处理 |
收稿时间: | 2021-03-24 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机与现代化》浏览原始摘要信息 |
|
点击此处可从《计算机与现代化》下载全文 |
|