首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
传统词袋模型仅仅是将图像表示成视觉单词的直方图,并没有考虑到物体的形状信息,也没有考虑到视觉特征的空间信息.因此将金字塔模型引入到词袋模型中,建立金字塔词袋模型,将金字塔词袋模型与金字塔直方图模型相结合,两种信息相互补充,共同来表征图像;在分类器设计方面采用SVM进行分类.通过在Caltech 101数据库进行实验,验证了论文方法的有效性,实验结果表明,该方法能够大幅度提高图像分类的性能.  相似文献   

2.
基于黎曼流形稀疏编码的图像检索算法   总被引:1,自引:0,他引:1  
针对视觉词袋(Bag-of-visual-words,BOVW)模型直方图量化误差大的缺点,提出基于稀疏编码的图像检索算法.由于大多数图像特征属于非线性流形结构,传统稀疏编码使用向量空间对其度量必然导致不准确的稀疏表示.考虑到图像特征空间的流形结构,选择对称正定矩阵作为特征描述子,构建黎曼流形空间.利用核技术将黎曼流形结构映射到再生核希尔伯特空间,非线性流形转换为线性稀疏编码,获得图像更准确的稀疏表示.实验在Corel1000和Caltech101两个数据集上进行,与已有的图像检索算法对比,提出的图像检索算法不仅提高了检索准确率,而且获得了更好的检索性能.  相似文献   

3.
为了进一步提高词袋模型在人脸识别中的性能,提出一种融和多种特征所建立的词袋模进行人脸识别的算法.首先提取人脸图像中的若干局部特征,分别基于每种特征离线训练视觉词典,将每种局部特征映射到对应的高维中层语义空间中,然后使用空间金字塔模型得到每种特征的人脸图像描述,最后将各种特征拼接起来并使用线性SVM完成对人脸图像的分类判别.在多个公开数据库上的实验结果表明,该算法对人脸的姿态、表情变化以及面部遮挡具有更优良的鲁棒性,能够更好地解决小样本问题.  相似文献   

4.
一种基于优化“词袋”模型的物体识别方法*   总被引:1,自引:0,他引:1  
针对传统基于“词袋”模型物体识别现有方法的不足,对现特征表达、视觉词典和图像表示方法进行优化,以提高物体识别正确率。采用HUE直方图与SIFT特征描述符分别描述兴趣点周围的颜色和形状特征,实现“词袋”模型下两种特征的特征级和图像级融合,引入K-means++聚类算法生成视觉词典,并利用软权重思想将特征向量映射到视觉单词形成图像直方图。实验结果表明,所述方法会产生较高的物体识别正确率,且识别结果不受两种特征融合权重的影响。  相似文献   

5.
三角形约束下的词袋模型图像分类方法   总被引:1,自引:0,他引:1  
汪荣贵  丁凯  杨娟  薛丽霞  张清杨 《软件学报》2017,28(7):1847-1861
视觉词袋模型广泛地应用于图像分类与图像检索等领域.在传统词袋模型中,视觉单词统计方法忽略了视觉词之间的空间信息以及分类对象形状信息,导致图像特征表示区分能力不足.本文提出了一种改进的视觉词袋方法,结合显著区域提取和视觉单词拓扑结构,不仅能够产生更具代表性的视觉单词,而且能够在一定程度上避免复杂背景信息和位置变化带来的干扰.首先,通过对训练图像进行显著区域提取,在得到的显著区域上构建视觉词袋模型.其次,为了更精确的描述图像的特征,抵抗多变的位置和背景信息的影响,该方法采用视觉单词拓扑结构策略和三角剖分方法,融入全局信息和局部信息.通过仿真实验,并与传统的词袋模型及其他模型进行比较,结果表明本文提出的方法获得了更高的分类准确率.  相似文献   

6.
针对目前词袋(BoF)特征压缩算法忽略编码矢量之间空间关系的问题,本文给出了压缩算法与金字塔模型相配合的图像分类步骤。同时以多个公开图像数据集为实验对象,对典型词袋特征压缩算法的性能进行比较性研究报道。实验结果表明,压缩算法对于视觉单词数目以及编码方法具有良好的鲁棒性;其中基于子空间方法的压缩算法在高层图像特征空间中的分类性能最优,在多个图像数据集上的分类性能最优,时间开销最小。  相似文献   

7.
近年来,基于bag-of-words模型的图像表示方法由于丢弃了视觉词汇之间的空间位置关系,且存在冗余信息,从而不能有效地表示该类图像。针对传统词袋模型视觉词汇之间相对位置关系利用不足,以及语义信息不明确的问题,提出采用基于支持区域的视觉短语来表示图像。通过支持区域探测得到图像中对分类起重要作用的支持区域,然后对支持区域上的视觉词进行空间建模得到视觉短语用于分类。最后在标准数据集UIUC-Sports8图像库和Scene-15图像库上进行对比实验,实验结果表明该算法具有良好的图像分类性能。  相似文献   

8.
为了在二维形状上寻求具有不变特征的形状描述,从三维的角度考察二维物体的形状信息,提出基于热核的形状分类算法.首先对原始物体的边界进行采样,并将内部区域三角化;然后通过优化的方法,把二维形状转化为表面光滑且封闭的三维网格曲面;最后提取三维模型表面的热核特征,利用词袋模型得到物体的特征向量,最终实现物体的形状分类.在MPEG-7与Animal Shapes数据库上的实验结果表明,与传统算法相比,该算法分类的准确率更高,鲁棒性更强.  相似文献   

9.
规则网格是视觉词袋模型中常用的图像检测方法,该方法抽取图像所有区块,获得背景区块和目标区块完整的图像信息。事实上,抽取的背景区块信息对类别的判定往往会有一定的混淆作用。以“摩托车”类和“小汽车”类的图像为例,这两类图像背景特征相似,大多都是道路,一般的分类方法很可能将它们分为相同类别。可见,背景信息会干扰图像分类结果。因此,提出一种提取目标区域词袋特征的图像分类方法。利用图像分割去除背景信息提取目标区域;对目标区域构建视觉词袋模型;使用SVM分类器对图像进行分类。PASCAL VOC2006及PASCAL VOC2010数据集上的实验结果表明,提取目标区域词袋特征的图像分类方法具有较好的分类性能。  相似文献   

10.
针对由图像灰度空间产生的传统词袋模型SIFT特征无法体现图像的颜色信息的问题,提出了一种融合颜色特征的视觉词汇树来对图像进行描述。提取SIFT特征并建立词汇树,获取图像的SIFT表示向量。利用K-means方法对图像库中的所有图像的HSV值进行聚类,获得基于HSV空间的颜色词袋表示向量,避免了传统颜色直方图方法所带来的量化误差。将SIFT特征与颜色词袋特征进行融合,完成了图像的全局特征和局部特征的融合。然后,计算融合特征的相似度,将相似度从高到低排序,完成图像检索。为了验证本方法的有效性,选择Corel图像库对算法性能进行实验分析,从主观评价和客观评价标准分别进行评价,并与传统方法进行了对比。结果表明,特征融合的检索性能与单一特征方法相比有较大提高。特征融合方法的平均检索查准率和查全率-查准率等评价指标,对比传统方法均有不同程度提高。  相似文献   

11.
在卷积神经网络模型中,空间金字塔池化方法将空间信息融入到深度特征的生成过程中,最终生成的图像表示可以有效地用于提高图像检索性能,但是此方法会导致生成的图像表示中不同维度之间描述的信息存在重复且相同维度描述的图像内容不匹配。为此提出了一种基于多尺度特征映射匹配(multi-scale feature map matching,MFMM)的图像表示方法,此方法首先利用深度特征的方差与协方差矩阵提出了一种特征映射选择算法,用于增强图像表示中不同维度特征的独立性。其次,依据相同通道特征映射中高响应值位置有较高匹配性的特点,结合激活映射中最大响应位置的深度特征提出了一种优化的特征映射中心点选择方法。最后,按照不同的中心点通过多尺度窗口采样的方式,从特征映射中提取出带有空间信息的深度特征用于表示图像内容。实验结果表明,提出的方法在图像检索任务中能够取得良好的效果。  相似文献   

12.
针对传统视觉词袋(Bag Of Visual Words,BOVW)模型缺少空间信息,且不能充分表达图像所属类别共有特征的问题,提出一种基于最大频繁项集的视觉词袋表示方法。该方法在排除孤立特征点的基础上,引入环形区域划分的思想,嵌入更多的空间信息。通过对不同环的视觉单词进行频繁项挖掘得到新的视觉单词表示,能有效提高同类别图像视觉单词的相似程度,而使不同类别视觉单词的差异更为显著。通过在图像数据集COREL及Caltech-256上进行分类实验,验证了该方法的有效性和可行性。  相似文献   

13.
14.
The assumption that antialiasing destroys useful visual information about object features is challenged in three experiments that examine the effects of antialiasing on the visual information for object location and motion. The results show that proper antialiasing eliminates the spurious visual information produced by sampling processes in image synthesis and allows the viewer's visual system to produce a precise representation of object location and a continuous representation of object motion. This suggests that in designing imagery systems, simply increasing the spatial and temporal addressability and resolution beyond limits set by the human visual system will have a negligible impact on image quality, but that effective use of antialiasing techniques could allow visual information about object features to be presented with great fidelity  相似文献   

15.
在图像分类识别中,对于同一目标的不同图像,其训练样本和测试样本在同一位置的像素强度通常不同,这不利于提取目标图像的显著特征。这里给出一种基于稀疏表示的联合表示的图像分类方法,此方法首先利用相邻列之间的关系得到原始图像对应的虚拟图像,利用虚拟图像提高图像中中等强度像素的作用,降低过大或过小强度像素对图像分类的影响;然后用同一个目标的原始图像和虚拟图像一起表示目标,得到目标图像的联合表示;最后利用联合表示方法对目标分类。针对不同目标图像库的实验研究表明,给出的联合方法优于利用单一图像进行分类的方法,而且本方法能联合不同的表示方法来提高图像分类正确率。  相似文献   

16.
朱杰  张俊三  吴树芳  董宇坤  吕琳 《计算机应用》2018,38(10):2778-2781
深度卷积特征能够为图像内容描述提供丰富的语义信息,为了在图像表示中突出对象内容,结合激活映射中较大响应值与对象区域的关系,提出基于多中心卷积特征加权的图像表示方法。首先,通过预训练深度模型提取出图像卷积特征;其次,通过不同通道特征映射求和得到激活映射,并将激活映射中有较大响应值的位置认为是对象的中心;再次,将中心数量作为尺度,结合激活映射中不同位置与中心的距离为对应位置的描述子加权;最后,合并不同中心数量下的图像特征,生成图像表示用于图像检索。与池化卷积(SPoC)算法和跨维度(CroW)算法相比,所提方法能够为图像表示提供尺度信息的同时突出对象内容,并在Holiday、Oxford和Paris图像集中取得了良好的检索结果。  相似文献   

17.
Semantic image segmentation aims to partition an image into non-overlapping regions and assign a pre-defined object class label to each region. In this paper, a semantic method combining low-level features and high-level contextual cues is proposed to segment natural scene images. The proposed method first takes the gist representation of an image as its global feature. The image is then over-segmented into many super-pixels and histogram representations of these super-pixels are used as local features. In addition, co-occurrence and spatial layout relations among object classes are exploited as contextual cues. Finally the features and cues are integrated into the inference framework based on conditional random field by defining specific potential terms and introducing weighting functions. The proposed method has been compared with state-of-the-art methods on the MSRC database, and the experimental results show its effectiveness.  相似文献   

18.
针对关节式目标变化对子空间描述造成的影响,本文提出了一种基于增量学习的关节式目标跟踪算法.该算法通过引入图像分割方法与快速傅里叶变换可有效消除背景像素对目标描述造成的影响以及目标区域前景目标位置对不准造成的误差,同时应用局部二值模式增加目标描述中像素点间的几何位置信息,应用基于增量学习的方法实现目标特征的在线更新,最终为跟踪算法提供较为精确的目标描述.实验结果表明,本文提出的关节式目标跟踪算法具有较好的目标跟踪效果.  相似文献   

19.
Object bank (OB) representation is a novel image representation for high-level visual tasks, which encodes semantic and spatial information of the objects within an image. However, the poor precision of the object detectors in OB method influences the extraction effect of high-level image feature. In order to solve this problem, a new OB method improved by Graph-Based Visual Saliency (GBVS) is proposed. Firstly, GBVS saliency model is utilized to process the image and detect the saliency regions and extract better high-level feature. The experiments results show that the proposed method performs better in classification and increases the classification accuracy of 4%.  相似文献   

20.
遥感影像中的空间对象及其边界具有模糊性。针对遥感影像中模糊对象的表现特征,借助云理论和云模型来对模糊对象进行表达研究。基于影像的灰度和梯度等数字特征,构建基于数字图像的对象云,用对象云表达模糊对象,核外半云环表达其边界,从而用模糊数学的方法来合理表达遥感影像模糊对象,最后以遥感影像为例进行验证。该方法不仅丰富和完善了云理论,同时也为模糊对象表达,遥感影像的理解和分析提供了一种新的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号