共查询到18条相似文献,搜索用时 97 毫秒
1.
采用词袋模型(BoW)对图像进行分类,并针对传统词袋模型存在的不足进行了改进,提出了一种特征软量化的方式。软赋值量化通过将局部显著特征量化(SIFT)为与其距离最近的若干个视觉单词,并对其进行加权,由此保存特征空间中的距离信息,从而解决硬赋值量化造成的特征空间信息损失问题。通过在Caltech 101数据库进行实验,验证了本文方法的有效性,实验结果表明,该方法能够大幅度提高图像分类的性能。 相似文献
2.
3.
一种基于词袋模型的图像优化分类方法 总被引:1,自引:0,他引:1
该文应用词袋模型对图像进行分类,并针对传统词袋模型存在的不足进行改进,提出了一种基于兴趣区域(Region Of Interest, ROI)提取以及金字塔匹配原理的优化方法。首先对训练图像进行ROI提取,对得到的ROI区域进行密集尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)特征的抽取和描述并生成视觉词典,由此产生的视觉词典更能精确的描述图像的特征,且能够抵抗多变的位置信息及背景信息的影响。其次应用金字塔匹配原理对图像进行基于视觉词典的直方图表示,代入支持向量机(Support Vector Machine, SVM)分类器进行分类。通过对Caltech 101和Caltech 256两个数据库进行实验,结果表明该方法较传统方法提高了分类的正确率,且能够在训练图像较少的情况下达到良好的分类效果。最后通过与现有同类方法的比较验证了该方法的优越性。 相似文献
4.
5.
6.
为了解决飞机、直升机、导弹等3类空中目标图像的自动分类问题,提出了一种基于改进词袋模型的空中目标识别方法。首先采集3类多个型号的空中目标灰度图像并分割提取出目标,接着利用稠密采样方法进行SIFT特征提取,然后用模糊C均值聚类方法,对空中目标图像的SIFT特征进行聚类,得到大量空中目标图像的视觉单词。最后用视觉单词直方图训练支持向量机分类器,完成空中目标的自动分类。仿真实验表明,文中提出的算法能准确区分空中目标类别,性能优于传统的采用K均值聚类的词袋模型,且优于仿射矩。 相似文献
7.
为了解决经典局部特征编码方法会产生相似局部特征之间编码系数不一致的问题,本文提出一种图正则化局部特征编码算法.该算法在对初始编码矢量所定义的能量化函数中引入正则化项,保证空间上相邻外观上相似的局部特征之间的编码矢量尽可能一致.MSRcv2、Caltech101、Scene 15以及Indoor 67四个公开数据集上的实验结果表明本文方法能够提高硬分配、软分配、稀疏编码、局部约束线性编码以及局部软分配五种经典编码方法的性能,并且基于本文编码算法的图像分类方法在上述四个公开数据集上的平均分类正确率分别达到了91.13%、76.02%、83.76%、44.78%. 相似文献
8.
9.
10.
《信息通信》2017,(10)
即时定位与地图构建(SLAM)是解决移动机器人在未知非结构化环境中自主导航与控制的关键,一个完整的SLAM系统包括传感器数据处理、位姿估计、构建地图、回环检测四个部分。其中回环检测机制是解决移动机器人的闭环重定位,提高SLAM系统鲁棒性的重要环节。该研究提出一种基于ORB词袋模型的SLAM系统框架,通过研究与分析了使用FLANN算法选取关键帧与匹配帧间特征点,ORB特征描述子对检测速度的提高,通过k-means++算法对特征点进行训练生成含有视觉单词的词袋模型,使用高斯金字塔的直方图交叉核的SVM分类器,使用e PNP算法的增量式帧间位姿估计,回环检测重定位机制等环节,实现了单目视觉SLAM系统的初始化与位姿优化,实现了在丢帧状况下通过词袋模型进行重定位。最后通过搭建实验平台和标准数据集的测试得到的数据结果表明,基于ORB词袋模型的SLAM系统,具有良好的实时性,能够有效提高SLAM系统的重定位准确性,增强了系统的鲁棒性。 相似文献
11.
"视觉词袋"(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标(Target of Interest,TOI)的"视觉词袋"算法。首先,对训练图像进行TOI选取,用灰度共生矩阵模型提取TOI的纹理特征,再结合灰度特征,组成多维特征向量集,以簇内相似度最高、数据分布密度最大为准则,生成"视觉词袋"。其次,对测试图像,依据已生成的"视觉词袋",采用支持向量机(Support Vector Machine,SVM)分类器,实现SAR图像感兴趣目标的有效分类。实验结果表明,与传统的"视觉词袋"构建算法相比,该算法在分类正确率提高的同时,能够在训练图像较少的情况下达到良好的分类效果。 相似文献
12.
Good representative dictionaries is the most critical part of the BoVW: Bag of Visual Words scheme, used for such tasks as category identification. The paradigm of learning dictionaries from datasets is by far the most widely used approach and there exists a plethora of methods to this effect. Dictionary learning methods demand abundant data, and when the amount of training data is limited, the quality of dictionaries and consequently the performance of BoVW methods suffer. A much less explored path for creating visual dictionaries starts from the knowledge of primitives in appearance models and creates families of parametric shape models. In this work, we develop shape models starting from a small number of primitives and develop a visual dictionary using various nonlinear operations and nonlinear combinations. Compared with the existing model-driven schemes, our method is able to represent and characterize images in various image understanding applications with competitive, and often better performance. 相似文献
13.
云模型相似度方法是对象相似性分析的一种重要方法.为提高图像分类的准确性,提出一种基于云模型相似度的图像分类方法.首先给出图像云模型的定义,然后根据云模型方法的逆向云算法对图像云模型特征进行数字特征计算,最后引入云模型相似性测度方法对图像云模型相似性进行测算并确定图像分类.仿真结果表明,文章所提方法可准确地对图像进行分类,且计算效率较高. 相似文献
14.
15.
16.
A personalized image retrieval based on visual perception 总被引:1,自引:0,他引:1
Zhang Jing Shen Lansun David Dagan Feng 《电子科学学刊(英文版)》2008,25(1):129-133
A new scheme named personalized image retrieval technique based on visual perception is proposed in this letter, whose motive is to narrow the semantic gap by directly perceiving user's visual information. It uses visual attention model to segment image regions and eye-tracking technique to record fixations. Visual perception is obtained by analyzing the fixations in regions to measure gaze interests. Integrating visual perception into attention model is to detect the Regions Of Interest (ROIs), whose features are extracted and analyzed, then feedback interests to optimize the results and construct user profiles. 相似文献
17.
The paper proposes a novel probabilistic generative model for simultaneous image classification and annotation.The model considers the fact that the category information can provide valuable information for image annotation.Once the category of an image is ascertained,the scope of annotation words can be narrowed,and the probability of generating irrelevant annotation words can be reduced.To this end,the idea that annotates images according to class is introduced in the model.Using variational methods,the approximate inference and parameters estimation algorithms of the model are derived,and efficient approximations for classifying and annotating new images are also given.The power of our model is demonstrated on two real world datasets:a 1 600-images LabelMe dataset and a 1 791-images UIUC-Sport dataset.The experiment results show that the classification performance is on par with several state-of-the-art classification models,while the annotation performance is better than that of several state-of-the-art annotation models. 相似文献
18.
为了解决传统高光谱图像分类方法精度低、计算成本高及未能充分利用空-谱信息的问题,本文提出一种基于多维度并行卷积神经网络(multidimensional parallel convolutional neural network,3D-2D-1D PCNN)的高光谱图像分类方法。首先,该算法利用不同维度卷积神经网络(convolutional neural network,CNN)提取高光谱图像信息中的空-谱特征、空间特征及光谱特征;之后,采用相同并行卷积层将组合后的空-谱特征、空间特征及光谱特征进行特征融合;最后,通过线性分类器对高光谱图像信息进行精准分类。本文所提方法不仅可以提取高光谱图像中更深层次的空间特征和光谱特征信息,同时能够将光谱图像不同维度的特征进行融合,减小计算成本。在Indian Pines、Pavia Center和Pavia University数据集上对本文算法和4种传统算法进行对比实验,结果表明,本文算法均得到最优结果,分类精度分别达到了99.210%、99.755%和99.770%。 相似文献