共查询到20条相似文献,搜索用时 31 毫秒
1.
传统词袋模型仅仅是将图像表示成视觉单词的直方图,并没有考虑到物体的形状信息,也没有考虑到视觉特征的空间信息.因此将金字塔模型引入到词袋模型中,建立金字塔词袋模型,将金字塔词袋模型与金字塔直方图模型相结合,两种信息相互补充,共同来表征图像;在分类器设计方面采用SVM进行分类.通过在Caltech 101数据库进行实验,验证了论文方法的有效性,实验结果表明,该方法能够大幅度提高图像分类的性能. 相似文献
2.
基于稀疏表示和词袋模型的高光谱图像分类 总被引:1,自引:0,他引:1
为增强高光谱图像稀疏表示分类方法中稀疏字典的表征能力并充分利用高光谱图像的光谱信息和空间信息,提出了一种新的基于稀疏表示和词袋模型的高光谱遥感图像分类方法。首先利用词袋模型算法结合高光谱遥感图像数据集生成各类别专业码本,作为字典中对应的原子构造稀疏表示字典。在计算每个像元的对应稀疏表示字典中的稀疏表示特征时,利用空间连续性约束对像元的稀疏表示系数进行空间维的约束。最后根据最小重构误差实现高光谱图像分类。高光谱遥感数据实验结果表明:所提方法能有效提高分类效果,并且其分类精度和Kappa系数都优于其他稀疏表示方法以及单独使用光谱信息的方法。 相似文献
3.
目的 稀疏编码是当前广泛使用的一种图像表示方法,针对稀疏编码及其改进算法计算过程复杂、费时等问题,提出一种哈希编码结合空间金字塔的图像分类算法。方法 首先,提取图像的局部特征点,构成局部特征点描述集。其次,学习自编码哈希函数,将局部特征点表示为二进制哈希编码。然后,在二进制哈希编码的基础上进行K均值聚类生成二进制视觉词典。最后,结合空间金字塔模型,将图像表示为空间金字塔直方图向量,并应用于图像分类。结果 在常用的Caltech-101和Scene-15数据集上进行实验验证,并和目前与稀疏编码相关的算法进行实验对比。与稀疏编码相关的算法相比,本文算法词典学习时间缩短了50%,在线编码速度提高了1.3~12.4倍,分类正确率提高了1%~5%。结论 提出了一种哈希编码结合空间金字塔的图像分类算法,利用哈希编码代替稀疏编码对局部特征点进行编码,并结合空间金字塔模型用于图像分类。实验结果表明,本文算法词典学习时间更短、编码速度更快,适用于在线词典学习和应用。 相似文献
4.
基于稀疏编码多尺度空间潜在语义分析的图像分类 总被引:1,自引:0,他引:1
《计算机学报》2014,(6)
传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义分析获得特征的精确性.为了弥补这些不足,文中提出了一种基于稀疏编码的多尺度空间潜在语义分析的图像分类方法.首先通过空间金字塔方法对图像进行空间多尺度划分,然后利用稀疏编码对每个局部块特征进行软量化以形成共生矩阵,之后结合概率潜在语义分析(PLSA)获得每个局部块的潜在语义信息,再利用权值串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息,最后用支持向量机(SVM)分类器完成图像的场景分类.在常见图像库上的实验表明,本文提出的基于稀疏编码的多尺度空间潜在语义分析方法平均分类精度比现有诸多方法均有明显提高,验证了其有效性和鲁棒性.实验还表明,空间金字塔匹配、稀疏编码共生矩阵以及PLSA降维这3个模块在该文方法中缺一不可,共同提升图像表征和分类性能. 相似文献
5.
针对视觉词袋(BOV)模型中过大的视觉词典会导致图像分类时间代价过大的问题,提出一种加权最大相关最小相似(W-MR-MS)视觉词典优化准则。首先,提取图像的尺度不变特征转换(SIFT)特征,并用K-Means算法对特征聚类生成原始视觉词典;然后,分别计算视觉单词与图像类别间的相关性,以及各视觉单词间的语义相似性,引入一个加权系数权衡两者对图像分类的重要程度;最后,基于权衡结果,删除视觉词典中与图像类别相关性弱、与视觉单词间语义相似性大的视觉单词,从而达到优化视觉词典的目的。实验结果表明,在视觉词典规模相同的情况下,所提方法的图像分类精度比传统基于K-Means算法的图像分类精度提高了5.30%;当图像分类精度相同的情况下,所提方法的时间代价比传统K-Means算法下的时间代价降低了32.18%,因此,所提方法具有较高的分类效率,适用于图像分类。 相似文献
6.
7.
三角形约束下的词袋模型图像分类方法 总被引:1,自引:0,他引:1
视觉词袋模型广泛地应用于图像分类与图像检索等领域.在传统词袋模型中,视觉单词统计方法忽略了视觉词之间的空间信息以及分类对象形状信息,导致图像特征表示区分能力不足.本文提出了一种改进的视觉词袋方法,结合显著区域提取和视觉单词拓扑结构,不仅能够产生更具代表性的视觉单词,而且能够在一定程度上避免复杂背景信息和位置变化带来的干扰.首先,通过对训练图像进行显著区域提取,在得到的显著区域上构建视觉词袋模型.其次,为了更精确的描述图像的特征,抵抗多变的位置和背景信息的影响,该方法采用视觉单词拓扑结构策略和三角剖分方法,融入全局信息和局部信息.通过仿真实验,并与传统的词袋模型及其他模型进行比较,结果表明本文提出的方法获得了更高的分类准确率. 相似文献
8.
9.
10.
基于稀疏编码的时空金字塔匹配的动作识别 总被引:1,自引:0,他引:1
针对复杂场景下的动作识别,提出一种基于稀疏编码的时空金字塔匹配的动作识别方法.通过稀疏编码的方法学习更具有判别性的码书和计算局部块(cuboids)的稀疏表示;然后基于max pooling的时空金字塔匹配进行动作分类.该方法在KTH和YouTube两大公开数据集上进行了评价,实验结果表明,与基于K-means的时空金字塔匹配方法相比,该方法提高了2%-7%左右的识别率,在复杂的视频中取得了较好的识别效果. 相似文献
11.
12.
人体行为分析为视频监控系统、视频检索系统提供重要的研究基础。本文提出了一种基于高层语义词袋模型
的人体行为识别方法。该方法根据底层词袋中词汇的相关关系,构造出一个基于词汇交互信息量的底层词汇图;然后使用层
次聚类的方法对该图进行分割,得到底层词汇组模型,最后将该模型表示为高层语义词袋模型。实验结果表明,该方法可以高
效地识别视频中的人体行为。 相似文献
13.
14.
特征表示是图像识别和分类的基础,视觉词袋是一种图像的特征表示方法。分析现有视觉词典构建方法的不足,提出一种新的视觉词典构建方法。首先利用梯度方差把特征矢量分为光滑类和边缘类,然后分别针对不同类别的特征矢量进行视觉词典的构建,最后根据两类视觉词典生成视觉词袋。图像分类实验表明,提出的新方法能提高分类准确率。 相似文献
15.
《计算机应用与软件》2017,(4)
为了提高图像检索的效率,提出一种基于视觉词袋模型的图像检索方法。一方面在图像局部特征提取算法中,使用添加渐变信息的盒子滤波器构造尺度空间,以保留图像更多的细节信息,另一方面在特征表达时仅计算一次特征点圆形邻域内的Haar小波响应,避免了Haar小波响应的重复计算,并在保证描述子旋转不变性的同时做降维处理。同时,以改进k-means对特征库聚类构建加权的视觉词典,基于概率计算的方式选取k-means初始聚类中心,降低了传统k-means聚类效果对初始聚类中心选择的敏感性。实验结果表明该方法比传统方法具有更高的效率,特征提取速度提高48%左右,查准率提高2%以上。 相似文献
16.
17.
18.
视觉词袋模型在基于内容的图像检索中已经得到了广泛应用,传统的视觉词袋模型一般采用SIFT描述子进行特征提取.针对SIFT描述子的高复杂度、特征提取时间较长的缺点,本文提出采用更加快速的二进制特征描述子ORB来对图像进行特征提取,建立视觉词典,用向量间的距离来比较图像的相似性,从而实现图像的快速检索.实验结果表明,本文提出的方法在保持较高鲁棒性的同时,明显高了图像检索的效率. 相似文献
19.