首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
邹承明  罗莹  徐晓龙 《计算机应用》2018,38(7):1853-1856
针对单一特征表示的局限性会导致细粒度图像分类准确度不高的问题,提出了一种基于卷积神经网络(CNN)和尺度不变特征转换(SIFT)的多特征组合表示方法,综合考虑对目标整体、关键部位和关键点的特征提取。首先,分别以细粒度图像库中的目标整体和头部区域训练CNN得到两个网络模型,用来提取目标的整体和头部CNN特征;然后,对图像库中所有目标区域提取SIFT关键点并通过K均值(K-means)聚类生成码本,再将每个目标区域的SIFT描述子通过局部特征聚合描述符(VLAD)参照码本编码为特征向量;最后,组合多种特征作为最终的特征表示,采用支持向量机(SVM)对细粒度图像进行分类。使用该方法在CUB-200-2011数据库上进行实验,并与单一的特征表示方法进行了比较。实验结果表明,该方法与基于单一CNN特征的细粒度图像分类相比提升了13.31%的准确度,证明了多特征组合对细粒度图像分类的积极作用。  相似文献   

2.
提出一种针对嵌入式系统的图像检索算法,通过提取目标局部特征来进行图像检索。为了提高检索的实时性并兼顾正确率,选用经典SIFT特征为基础进行改进。在关键点检测阶段使用均值滤波代替高斯滤波大大提高特征提取速度。在描述符生成阶段通过稀疏矩阵将SIFT特征映射为二进制描述符。引入基于K-means的 Multi-probe LSH方法对二进制描述符进行快速检索和匹配。通过一系列的图像缩放、旋转、模糊和光照变化对比实验,可以看出该算法与现有的经典算法相比在检索正确率及实时性方面均有很好的表现。  相似文献   

3.
局部描述符(如SIFT)方法能够将图像中关键点的局部表观信息作为图像的特征,具有旋转不变性、尺度变换不变性、仿射不变性等性质,被广泛应用于物体分类、物体识别、图像匹配等领域。但是,它存在一个重要缺陷:只能描述物体的局部特征,忽略了整个物体的构造,而这在表示物体时是非常重要的。设计了一个新的"结构上下文"局部描述符,通过当前关键点和其他关键点间的空间拓扑结构关系描述各个关键点的特征。实验证明这种描述符在描述相同物体种类时特别有效。  相似文献   

4.
为了检测视场开阔下的人群密集情况,采用基于图像局部特征点提取的SIFT算法。首先,对人群图像预处理,其中包括灰度化、直方图均衡化、二值化和形态学处理等。其次采用背景差分法进行视频图像的前景提取。再次,采取SIFT算法对图像中的人群部分进行特征点的检测,采取高斯核对待检测的人群图像进行尺度变换,获得图像的尺度空间表示序列。之后对极值点检测和精确定位,然后指定其方向参数,生成关键点描述子。最后,统计人群目标生成的关键点的数目。根据关键点数目判断人群密集程度。多组实验数据表明,该方案能较好地检测出视频图像中的人群密集情况。  相似文献   

5.
采用快速SIFT算法实现目标识别   总被引:1,自引:0,他引:1  
在基于原始SIFT算法的目标识别中,特征描述符的计算复杂,特征点的匹配时间较长,为此提出一种快速SIFT算法。该算法采用同心圆形窗口内的灰度累加值和差分值构建16维的简化描述符,并且在目标识别时,按照金字塔结构由粗至精进行特征点匹配。实验表明,在保证目标识别准确率的前提下,快速算法的运算时间比原始SIFT算法减少了两个数量级,具有很好的实时性能。  相似文献   

6.
一种基于优化“词袋”模型的物体识别方法*   总被引:1,自引:0,他引:1  
针对传统基于“词袋”模型物体识别现有方法的不足,对现特征表达、视觉词典和图像表示方法进行优化,以提高物体识别正确率。采用HUE直方图与SIFT特征描述符分别描述兴趣点周围的颜色和形状特征,实现“词袋”模型下两种特征的特征级和图像级融合,引入K-means++聚类算法生成视觉词典,并利用软权重思想将特征向量映射到视觉单词形成图像直方图。实验结果表明,所述方法会产生较高的物体识别正确率,且识别结果不受两种特征融合权重的影响。  相似文献   

7.
针对行李安检时X射线图像中的危险品检测问题,提出一种基于尺度不变特征变换(SIFT)和隐式形状模型(ISM)的检测方法。首先,采集不同姿态的危险品X射线图像,并标注目标位置,构建训练数据集。然后,通过SIFT算法提取目标关键点,并以此构建目标的ISM模型。在检测过程中,将提取的目标SIFT描述符与ISM模型中的视觉描述符进行匹配,通过投票机制来判断目标是否为危险品。通过手枪和酒瓶的检测实验表明,该方法能够从X射线图像中准确检测出危险品,且对目标姿态变化具有鲁棒性。  相似文献   

8.
由于SIFT特征是一种性能良好的局部特征,常被广泛应用于图像匹配,但SIFT特征点有128维描述符,所以具有匹配复杂度高和计算量大等缺点。为了提高图像匹配效率,研究了一种新的图像匹配方法。该方法通过构建尺度空间、检测极值点、确定关键点等步骤生成SIFT关键特征点;然后利用特征点周围邻域点的旋转不变LTP特征和相对灰度直方图来描述,替代传统SIFT特征点的128维描述,图像匹配过程中使用街区距离代替欧氏距离;最后利用光照变化、模糊变化、尺度和旋转综合变化三组图像进行算法仿真匹配实验。实验结果表明,本算法在图像尺度、旋转、光照变化条件下具有更高的匹配精确度,并且有效地提高了图像的匹配速度。  相似文献   

9.
提出一种利用隐马尔可夫模型建立目标特征匹配库来识别图像中局部遮挡目标的新方法。该方法首先通过SIFT算法提取目标SIFT特征,然后采用隐马尔可夫模型对目标所有的SIFT特征进行训练,得到目标SIFT特征对应的模型输出概率范围,将该概率范围作为目标特征匹配库。在对图像中的目标进行识别时,利用目标特征匹配库可以把目标特征从图像所有特征中识别出来,即使目标遮挡比例为60%时,该方法仍能识别出目标。实验结果表明,新方法可以精准地识别出图像中被遮挡目标,能够很好地解决遮挡情况下的目标识别问题。与现有局部遮挡目标识别算法相比,新方法所取得的目标识别率均有所提高。  相似文献   

10.
针对三维点云的快速识别问题,文中提出基于局部曲面特征直方图的点云识别算法.首先,采用循环体素滤波算法,将不同分辨率的点云滤波至指定分辨率.再基于邻域曲率均值最大的关键点查找算法选取点云局部特征较明显的点作为关键点,根据关键点邻域内点云重心与邻域曲面内各点的法线和距离的关系计算关键点的特征描述符.然后,根据临近关键点间的空间关系和特征描述符欧氏距离进行特征匹配.最后,采用多线程识别框架,加快在线识别速度.实验表明文中算法识别速度较快.  相似文献   

11.
针对现有人体动作识别方法需输入固定长度的视频段、未充分利用时空信息等问题,提出一种基于时空金字塔和注意力机制相结合的深度神经网络模型,将包含时空金字塔的3D-CNN和添加时空注意力机制的LSTM模型相结合,实现了对视频段的多尺度处理和对动作的复杂时空信息的充分利用。以RGB图像和光流场作为空域和时域的输入,以融合金字塔池化层的运动和外观特征后的融合特征作为融合域的输入,最后采用决策融合策略获得最终动作识别结果。在UCF101和HMDB51数据集上进行实验,分别取得了94.2%和70.5%的识别准确率。实验结果表明,改进的网络模型在基于视频的人体动作识别任务上获得了较高的识别准确率。  相似文献   

12.
目的 食物图片具有结构多变、背景干扰大、类间差异小、类内差异大等特点,比普通细粒度图片的识别难度更大。目前在食物图片识别领域,食物图片的识别与分类仍存在精度低、泛化性差等问题。为了提高食物图片的识别与分类精度,充分利用食物图片的全局与局部细节信息,本文提出了一个多级卷积特征金字塔的细粒度食物图片识别模型。方法 本文模型从整体到局部逐级提取特征,将干扰较大的背景信息丢弃,仅针对食物目标区域提取特征。模型主要由食物特征提取网络、注意力区域定位网络和特征融合网格3部分组成,并采用3级食物特征提取网络的级联结构来实现特征由全局到局部的转移。此外,针对食物图片尺度变化大的特点,本文模型在每级食物特征提取网络中加入了特征金字塔结构,提高了模型对目标大小的鲁棒性。结果 本文模型在目前主流公开的食物图片数据集Food-101、ChineseFoodNet和Food-172上进行实验,分别获得了91.4%、82.8%、90.3%的Top-1正确率,与现有方法相比提高了1%~8%。结论 本文提出了一种多级卷积神经网络食物图片识别模型,可以自动定位食物图片区分度较大的区域,融合食物图片的全局与局部特征,实现了食物图片的细粒度识别,有效提高了食物图片的识别精度。实验结果表明,该模型在目前主流食物图片数据集上取得了最好的结果。  相似文献   

13.
人脸表情是人类内心情绪最真实最直观的表达方式之一,不同的表情之间具有细微的类间差异信息。因此,提取表征能力较强的特征成为表情识别的关键问题。为提取较为高级的语义特征,在残差网络(ResNet)的基础上提出一种注意力金字塔卷积残差网络模型(APRNET50)。该模型融合金字塔卷积模块、通道注意力和空间注意力。首先用金字塔卷积提取图像的细节特征信息,然后对所提特征在通道和空间维度上分配权重,按权重大小定位显著区域,最后通过全连接层构建分类器对表情进行分类。以端到端的方式进行训练,使得所提网络模型更适合于精细的面部表情分类。实验结果表明,在FER2013和CK+数据集上识别准确率可以达到73.001%和94.949%,与现有的方法相比识别准确率分别提高了2.091个百分点和0.279个百分点,达到了具有相对竞争力的效果。  相似文献   

14.
This paper presents a novel appearance-based technique for topological robot localization and place recognition. A vocabulary of visual words is formed automatically, representing local features that frequently occur in the set of training images. Using the vocabulary, a spatial pyramid representation is built for each image by repeatedly subdividing it and computing histograms of visual words at increasingly fine resolutions. An information maximization technique is then applied to build a hierarchical classifier for each class by learning informative features. While top-level features in the hierarchy are selected from the coarsest resolution of the representation, capturing the holistic statistical properties of the images, child features are selected from finer resolutions, encoding more local characteristics, redundant with the information coded by their parents. Exploiting the redundancy in the data enables the localization system to achieve greater reliability against dynamic variations in the environment. Achieving an average classification accuracy of 88.9% on a challenging topological localization database, consisting of twenty seven outdoor places, demonstrates the advantages of our hierarchical framework for dealing with dynamic variations that cannot be learned during training.  相似文献   

15.
郭玉慧  梁循 《计算机学报》2022,45(1):98-114
如何识别同一物体的不同结构的表现形式,对于机器而言,是一个比较困难的识别工作.本文以易变形的纸币为例,提出了一种基于异构特征聚合的局部视图扭曲型纸币识别方法.首先利用灰度梯度共生矩阵、Haishoku算法和圆形LBP分别获得纹理风格、色谱风格和纹理,这些特征从不同的角度描述了局部纸币图像,然后通过VGG-16、ResN...  相似文献   

16.
为构建在线生物文献核磁共振图像库,通过分析在线医学文献图像的特点,用塔式梯度方向直方图进行图像特征提取,结合图像对应的文本标注,采用基于高斯过程的分类方法设计实现了一个在线生物文献MRI图像识别系统。实验结果表明,该系统比基于单一特征的系统识别率更高,同时比基于标准的SVM和KNN的识别方法性能更好。表明该系统的设计是可行、可靠和有效的。  相似文献   

17.
现有的篡改检测方法中特征点提取不充分会导致篡改检测精度不高,特征点描述符识别率差,针对该问题提出一种基于颜色矩的区域划分和四元数Hu矩的彩色图像复制粘贴篡改检测算法。首先,使用自适应形态重建算法对图像进行超像素分割,通过密度聚类算法对图像自适应划分区域;其次,提出一种关键点提取方法得到均匀的SIFT特征点;然后,在一种新颖的彩色图像四元数表示方法中构建局部高斯金字塔提取Hu矩特征;最后,利用2NN进行特征匹配后,结合Delaunay三角形算法定位出复制粘贴篡改区域。在公共数据集上的实验结果表明,该算法可以更有效地定位篡改区域。  相似文献   

18.
由于卷积神经网络(CNN)大多侧重于全局特征学习,忽略了包含更多细节的局部特征信息,使得室内场景识别的准确率难以提高。针对这一问题,提出了基于改进全局—局部注意网络(GLANet)的室内场景识别方法。首先,利用GLANet捕捉场景图像的全局特征和局部特征,增加图像特征中的细节信息;然后,在局部网络中引入non-local注意力模块,通过注意力图和特征图的卷积来进一步保留图像的细节特征,最后融合网络不同阶段的多种特征进行分类。通过在MIT Indoor67和SUN397数据集上的训练和验证,所提方法的识别准确率与LGN方法相比分别提高了1.98%和3.07%。实验结果表明,该算法能够有效捕获全局语义信息和精细的局部细节,显著提高了识别准确率。  相似文献   

19.
基于深度学习的高分辨率遥感图像建筑物识别   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决当前深度学习方法在高分辨率遥感图像中存在识别结果过度分割,以及小物体识别差的问题,提出一种基于SegNet架构改进的网络模型AA-SegNet,增加了增强的空间金字塔池化模块和空间注意力融合模块。该网络可以加强特征传播并能够有效传递更高级别的特征信息以抑制低级特征的噪声,并且可以增强小目标特征学习。基于高分二号遥感影像制作数据集并进行实验,AA-SegNet网络总体识别准确率为96.61%,在识别率、[F1]分数以及训练时间等方面也都优于SegNet、U-Net、DeepLab-V3网络。  相似文献   

20.
赵炯  樊养余 《测控技术》2010,29(11):37-40
提出一种新的KCCA特征融合算法。首先分别提取目标图像的局部特征SIFT和全局Pseudo-Zernike矩特征,并利用K-means算法对局部特征进行预处理;然后利用KCCA将两种特征提取相关特征进行融合,最后将融合特征送入SVM分类器。对遥感飞机图像库做了分类识别的仿真实验。相比于单一特征和CCA特征融合的识别策略,KCCA识别率得到明显提高,理论分析和实验结果证实了该算法具有良好的准确性与可靠性,能够有效提高图像分类识别系统的准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号