融合词袋连通图的图像检索特征选择 |
| |
作者姓名: | 李国祥 王继军 马文斌 |
| |
作者单位: | 广西财经学院教务处, 南宁 530003;广西师范大学广西多源信息挖掘与安全重点实验室, 桂林 541004;广西师范大学广西多源信息挖掘与安全重点实验室, 桂林 541004;广西财经学院信息与统计学院, 南宁 530003 |
| |
基金项目: | 国家自然科学基金项目(71862003);广西重点研发计划项目(2018AB15003);广西多源信息挖掘与安全重点实验室开放基金项目(MIMS17-02);广西高校中青年教师基础能力提升资助项目(2021KY0650,2019KY0661);广西跨境电商智能信息处理重点实验室培育基地(广西财经学院)专项资助项目 |
| |
摘 要: | 目的 随着图像检索所依赖的特征愈发精细化,在提高检索精度的同时,也不可避免地产生众多非相关和冗余的特征。针对在大规模图像检索和分类中高维度特征所带来的时间和空间挑战,从减少特征数量这一简单思路出发,提出了一种有效的连通图特征点选择方法,探寻图像检索精度和特征选择间的平衡。方法 基于词袋模型(bag of words,BOW)的图像检索机制,结合最近邻单词交叉核、特征距离和特征尺度等属性,构建包含若干个连通分支和平凡图的像素级特征分离图,利用子图特征点的逆文本频率修正边权值,从各连通分量的节点数量和孤立点最近邻单词相关性两个方面开展特征选择,将问题转化为在保证图像匹配精度情况下,最小化特征分离图的阶。结果 实验采用Oxford和Paris公开数据集,在特征存储容量、时间复杂度集和检索精度等方面进行评估,并对不同特征抽取和选择方法进行了对比。实验结果表明选择后的特征数量和存储容量有效约简50%以上;100 k词典的KD-Tree查询时间减少近58%;相对于其他编码方法和全连接层特征,Oxford数据集检索精度平均提升近7.5%;Paris数据集中检索精度平均高于其他编码方法4%,但检索效果不如全连接层特征。大量实验表明了大连通域的冗余性和孤立点的可选择性。结论 通过构建特征分离图,摒弃大连通域的冗余特征点,保留具有最近邻单词相关性的孤立特征点,最终形成图像的精简特征点集。整体检索效果稳定,其检索精度基本与原始特征点集持平,且部分类别效果优于原始特征和其他方法。同时,选择后特征的重用性好,方便进一步聚合集成。
|
关 键 词: | 词袋模型(BOW) 特征选择 图像检索 连通分量 聚合特征 |
收稿时间: | 2020-07-16 |
修稿时间: | 2020-10-28 |
|
|