融合视觉感知特性的场景分类算法 |
| |
作者姓名: | 史静 朱虹 王栋 杜森 |
| |
作者单位: | 西安理工大学自动化与信息工程学院, 西安 710048,西安理工大学自动化与信息工程学院, 西安 710048,西安理工大学自动化与信息工程学院, 西安 710048,西安理工大学自动化与信息工程学院, 西安 710048 |
| |
基金项目: | 国家自然科学基金项目(61502385,61673318);西安市科技计划项目(CXY1509(13));西安理工大学教学研究重点项目(xjy1670) |
| |
摘 要: | 目的 目前对于场景分类问题,由于其内部结构的多样性和复杂性,以及光照和拍摄角度的影响,现有算法大多通过单纯提取特征进行建模,并没有考虑场景图像中事物之间的相互关联,因此,仍然不能达到一个理想的分类效果。本文针对场景分类中存在的重点和难点问题,充分考虑人眼的视觉感知特性,利用显著性检测,并结合传统的视觉词袋模型,提出了一种融合视觉感知特性的场景分类算法。方法 首先,对图像进行多尺度分解,并提取各尺度下的图像特征,接着,检测各尺度下图像的视觉显著区域,最后,将显著区域信息与多尺度特征进行有机融合,构成多尺度融合窗选加权SIFT特征(WSSIFT),对场景进行分类。结果 为了验证本文算法的有效性,该算法在3个标准数据集SE、LS以及IS上进行测试,并与不同方法进行比较,分类准确率提高了约3%~17%。结论 本文提出的融合视觉感知特性的场景分类算法,有效地改善了单纯特征描述的局限性,并提高了图像的整体表达。实验结果表明,该算法对于多个数据集都具有较好的分类效果,适用于场景分析、理解、分类等机器视觉领域。
|
关 键 词: | 视觉感知 场景分类 多尺度 特征融合 WSSIFT特征 |
收稿时间: | 2017-05-23 |
修稿时间: | 2017-08-28 |
|
|