目标提取与哈希机制的多标签图像检索期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

目标提取与哈希机制的多标签图像检索

作者姓名：	陈飞吕绍和李军王晓东窦勇

作者单位：	国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073,国防科学技术大学并行与分布处理重点实验室, 长沙 410073

基金项目：	国家自然科学基金项目(U1435219)

摘要：	目的哈希是大规模图像检索的有效方法。为提高检索精度,哈希码应保留语义信息。图像之间越相似,其哈希码也应越接近。现有方法首先提取描述图像整体的特征,然后生成哈希码。这种方法不能精确地描述图像包含的多个目标,限制了多标签图像检索的精度。为此提出一种基于卷积神经网络和目标提取的哈希生成方法。方法首先提取图像中可能包含目标的一系列区域,然后用深度卷积神经网络提取每个区域的特征并进行融合,通过生成一组特征来刻画图像中的每个目标,最后再产生整幅图像的哈希码。采用Triplet Loss的训练方法,使得哈希码尽可能保留语义信息。结果在VOC2012、Flickr25K和NUSWIDE数据集上进行多标签图像检索。在NDCG(normalized discounted cumulative gain)性能指标上,当返回图像数量为 1 000时,对于VOC2012,本文方法相对于DSRH(deep semantic ranking hashing)方法提高24个百分点,相对于ITQ-CCA(iterative quantization-canonical correlation analysis)方法能提高36个百分点;对于Flickr25,本文方法比DSRH方法能提高2个左右的百分点;对于NUSWIDE,本文方法相对于DSRH方法能提高4个左右的百分点。对于平均检索准确度,本文方法在NUSWIDE和Flickr25上能提高25个百分点。根据多项评价指标可以看出,本文方法能以更细粒度来精确地描述图像,显著提高了多标签图像检索的性能。结论本文新的特征学习模型,对图像进行细粒度特征编码是一种可行的方法,能够有效提高数据集的检索性能。
关键词：	图像检索卷积神经网络哈希多标签
收稿时间：	2016-08-01
修稿时间：	2016-09-18

	点击此处可从《中国图象图形学报》浏览原始摘要信息
	点击此处可从《中国图象图形学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏