目标提取与哈希机制的多标签图像检索 |
| |
作者姓名: | 陈飞 吕绍和 李军 王晓东 窦勇 |
| |
作者单位: | 国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073 |
| |
基金项目: | 国家自然科学基金项目(U1435219) |
| |
摘 要: | 目的 哈希是大规模图像检索的有效方法。为提高检索精度,哈希码应保留语义信息。图像之间越相似,其哈希码也应越接近。现有方法首先提取描述图像整体的特征,然后生成哈希码。这种方法不能精确地描述图像包含的多个目标,限制了多标签图像检索的精度。为此提出一种基于卷积神经网络和目标提取的哈希生成方法。方法 首先提取图像中可能包含目标的一系列区域,然后用深度卷积神经网络提取每个区域的特征并进行融合,通过生成一组特征来刻画图像中的每个目标,最后再产生整幅图像的哈希码。采用Triplet Loss的训练方法,使得哈希码尽可能保留语义信息。结果 在VOC2012、Flickr25K和NUSWIDE数据集上进行多标签图像检索。在NDCG(normalized discounted cumulative gain)性能指标上,当返回图像数量为 1 000时,对于VOC2012,本文方法相对于DSRH(deep semantic ranking hashing)方法提高24个百分点,相对于ITQ-CCA(iterative quantization-canonical correlation analysis)方法能提高36个百分点;对于Flickr25,本文方法比DSRH方法能提高2个左右的百分点;对于NUSWIDE,本文方法相对于DSRH方法能提高4个左右的百分点。对于平均检索准确度,本文方法在NUSWIDE和Flickr25上能提高25个百分点。根据多项评价指标可以看出,本文方法能以更细粒度来精确地描述图像,显著提高了多标签图像检索的性能。结论 本文新的特征学习模型,对图像进行细粒度特征编码是一种可行的方法,能够有效提高数据集的检索性能。
|
关 键 词: | 图像检索 卷积神经网络 哈希 多标签 |
收稿时间: | 2016-08-01 |
修稿时间: | 2016-09-18 |
|
| 点击此处可从《中国图象图形学报》浏览原始摘要信息 |
|
点击此处可从《中国图象图形学报》下载全文 |
|