基于视觉词汇形状描述的图像表示方法 |
| |
引用本文: | 王红霞,杨克俭,张敏,艾浩军,陈先桥.基于视觉词汇形状描述的图像表示方法[J].计算机工程与应用,2012,48(21):191-196,204. |
| |
作者姓名: | 王红霞 杨克俭 张敏 艾浩军 陈先桥 |
| |
作者单位: | 1. 武汉理工大学计算机科学与技术学院,武汉,430063 2. 武汉大学计算机学院,武汉,430072 |
| |
基金项目: | 国家自然科学基金(No.51179146);武汉市科学技术局科技攻关计划项目(No.201010621208) |
| |
摘 要: | 针对目前图像表示中引入空间位置信息的空间金字塔匹配方法缺乏对图像中视觉物体平移、缩放和旋转的考虑,提出一种基于视觉词汇形状描述模型的图像表示方法。该方法相对于每个视觉单词的几何中心建立空间几何模型,保证平移不变性;给出对数极坐标空间金字塔匹配,对对数极半径做归一化,保证缩放不变性;在空间金字塔划分过程中确定极角的主方向,从而保证旋转不变性。分别在Caltech-101数据集和自建图像数据集上对该方法进行了验证和比较。实验结果表明,该方法提高了分类识别准确率,特别是对于包含明显平移、缩放和旋转变化的图像数据集;该方法的方差较小,说明其鲁棒性更强。
|
关 键 词: | 物体分类 视觉词袋模型 图像表示 空间金字塔匹配 视觉词汇形状描述模型 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|