首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
图像中所蕴含的属性对于图像识别有着重要作用,以往的传统分类方法往往忽略了这些特性,为此,提出一种将稀疏表示和属性学习结合用于图像分类的新方法。该方法首先对图像特征进行稀疏分解,利用系数稀疏表示重构图像特征,然后将重构的特征数据用于属性学习,通过属性分类器的训练学习完成对目标图像的属性识别,达到识别出图像种类的目的。在植物数据集上的对比试验证实了该算法的有效性和在识别准确率上相对于传统识别算法的提升。  相似文献   

2.
人脸属性迁移作为计算机视觉领域的一个研究热点,对于数字娱乐制作、辅助人脸识别等领域有着重要的意义.现有的算法存在着生成图像模糊、转移属性无关区域变化等问题.针对这些不足,提出一种基于视觉注意力生成对抗网络的人脸属性迁移模型.生成器为减小属性无关区域的变化,引入视觉注意力分别输出RGB图像和注意力图像,并通过一定的融合方...  相似文献   

3.
4.
针对传统工业机器人辨识复杂工件困难、识别度单一等问题,提出一种基于迁移学习的视觉识别与分拣策略。高精度工业相机拍摄到的图片经过HALCON软件图像膨胀、腐蚀等处理之后,导入Pytorch中的神经网络模型,利用迁移学习对目标进行识别分类,最终实现工业机器人智能分拣的目的。实验中,在UR5机器人平台上以形状多变的两种菇类为对象进行迁移学习,进而完成识别及分拣。实验结果表明该策略具备良好的准确性和稳定性。  相似文献   

5.
监控场景中的行人属性识别任务旨在为监控场景中视频摄像头捕捉的行人图片预测其属性类别,由于监控场景环境的复杂以及行人属性的细粒度标签,监控场景中的行人属性识别任务极具挑战,受到业界和学界的广泛关注.文中对监控场景中的行人属性识别研究进展进行梳理,首先给出了其概念范畴与任务定义,并与其他相似的属性识别任务进行对比.其次,文中对目前主流的行人属性识别数据库进行了简单介绍,并从图片和标注两个角度分析了不同数据库之间的异同.再次,文中对深度学习时代以来所提出的各种行人属性识别方法进行了归纳和总结,综述了目前行人属性识别领域的研究现状.最后,文中对监控场景中的行人属性识别存在的问题进行了思考和讨论,并对未来的发展趋势进行了展望.  相似文献   

6.
一种用于图像分类的多视觉短语学习方法   总被引:2,自引:0,他引:2  
针对词袋图像表示模型的语义区分性和描述能力有限的问题,以及由于传统的基于词袋模型的分类方法性能容易受到图像中背景、遮挡等因素影响的问题,本文提出了一种用于图像分类的多视觉短语学习方法.通过构建具有语义区分性和空间相关性的视觉短语取代视觉单词,以改善图像的词袋模型表示的准确性.在此基础上,结合多示例学习思想,提出一种多视觉短语学习方法,使最终的分类模型能反映图像类别的区域特性.在一些标准测试集合如Calrech-101[1]和Scene-15[2]上的实验结果验证了本文所提方法的有效性,分类性能分别相对提高了约9%和7%.  相似文献   

7.
在图像分类的实际应用过程中,部分类别可能完全没有带标签的训练数据。零样本学习(ZSL)的目的是将带标签类别的图像特征等知识迁移到无标签的类别上,实现无标签类别的正确分类。现有方法在测试时无法显式地区分输入图像属于已知类还是未知类,很大程度上导致未知类在传统设定下的ZSL和广义设定下的ZSL(GZSL)上的预测效果相差甚远。为此,提出一种融合视觉误差与属性语义信息的方法来缓解零样本图像分类中的预测偏置问题。首先,设计一种半监督学习方式的生成对抗网络架构来获取视觉误差信息,由此预测图像是否属于已知类;然后,提出融合属性语义信息的零样本图像分类网络来实现零样本图像分类;最后,测试融合视觉误差与属性语义的零样本图像分类方法在数据集AwA2和CUB上的效果。实验结果表明,与对比模型相比,所提方法有效缓解了预测偏置问题,其调和指标H在AwA2(Animal with Attributes)上提升了31.7个百分点,在CUB(Caltech-UCSD-Birds-200-2011)上提升了8.7个百分点。  相似文献   

8.
深度学习在目标视觉检测中的应用进展与展望   总被引:2,自引:0,他引:2  
张慧  王坤峰  王飞跃 《自动化学报》2017,43(8):1289-1305
目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来,深度学习在图像分类研究中取得了突破性进展,也带动着目标视觉检测取得突飞猛进的发展.本文综述了深度学习在目标视觉检测中的应用进展与展望.首先对目标视觉检测的基本流程进行总结,并介绍了目标视觉检测研究常用的公共数据集;然后重点介绍了目前发展迅猛的深度学习方法在目标视觉检测中的最新应用进展;最后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,并对今后的发展趋势进行展望.  相似文献   

9.
针对图像分类任务中卷积网络提取图像细粒度特征能力不足、多属性之间的依赖关系无法识别的问题,提出一种基于YOLOv5的车辆多属性分类方法 Multi-YOLOv5。该方法设计了多头非极大值抑制(Multi-NMS)和分离式标签损失(Separate-Loss)函数协同工作机制实现车辆的多属性分类任务,并采用卷积块注意力模块(CBAM)、SA(Shuffle Attention)和CoordConv方法重构了YOLOv5检测模型,分别从提升多属性特征能力提取、增强不同属性之间的关联关系、增强网络对位置信息的感知能力三方面提升模型对目标多属性分类的精准性。在VeRi等数据集上进行了训练与测试,实验结果表明,与基于GoogLeNet、残差网络(ResNet)、EfficientNet、ViT(Vision Transformer)等的网络结构相比,Multi-YOLOv5方法在目标的多属性分类方面取得了较好的识别结果,在VeRi数据集上,它的平均精度均值(mAP)达到了87.37%,较上述表现最佳的方法提高了4.47个百分点,且比原YOLOv5模型具有更好的鲁棒性,能为密集环境下的交通目标感知...  相似文献   

10.
徐苏平  杨习贝  祁云嵩 《计算机应用》2015,35(11):3218-3221
在多标记学习中,由于不同的标记可能会带有自身的一些特性,所以目前已经出现了基于标记类属属性的多标记学习算法LIFT.然而,类属属性的构建可能会增加属性向量的维度,致使属性空间存在冗余信息.为此,借助模糊粗糙集提出了一种能够进行类属属性约简的多标记学习算法FRS-LIFT,其包含4个步骤:类属属性构建、属性维度约简、分类模型训练和未知样本预测.在5个多标记数据集上的实验结果表明,该算法与LIFT算法相比,不仅能够降低类属属性维数,而且在5种多标记评价指标上均具有较好的实验效果.  相似文献   

11.
Learning Boolean Functions in an Infinite Attribute Space   总被引:2,自引:1,他引:1  
This paper presents a theoretical model for learning Boolean functions in domains having a large, potentially infinite number of attributes. The model allows an algorithm to employ a rich vocabulary to describe the objects it encounters in the world without necessarily incurring time and space penalties so long as each individual object is relatively simple. We show that many of the basic Boolean functions learnable in standard theoretical models, such as conjunctions, disjunctions, K-CNF, and K-DNF, are still learnable in the new model, though by algorithms no longer quite so trivial as before. The new model forces algorithms for such classes to act in a manner that appears more natural for many learning scenarios.  相似文献   

12.
为解决传统人脸属性分类训练效率低、模型参数量巨大等问题,本文提出了一种多网络学习框架.该框架包含两个子网络:人脸区域定位网络和属性分类网络,从而实现动态选择不同的人脸区域进行人脸属性预测.此外,本文提出了基于提示的模型压缩技术,在不明显降低准确率的前提下大大压缩网络参数.最后,通过仿真在CelebA人脸属性分类数据集上...  相似文献   

13.
唐诗淇  文益民  秦一休 《软件学报》2017,28(11):2940-2960
近年来,迁移学习得到越来越多的关注.现有的在线迁移学习算法一般从单个源领域迁移知识,然而,当源领域与目标领域相似度较低时,很难进行有效的迁移学习.基于此,提出了一种基于局部分类精度的多源在线迁移学习方法——LC-MSOTL.LC-MSOTL存储多个源领域分类器,计算新到样本与目标领域已有样本之间的距离以及各源领域分类器对其最近邻样本的分类精度,从源领域分类器中挑选局部精度最高的分类器与目标领域分类器加权组合,从而实现多个源领域知识到目标领域的迁移学习.在人工数据集和实际数据集上的实验结果表明,LC-MSOTL能够有效地从多个源领域实现选择性迁移,相对于单源在线迁移学习算法OTL,显示出了更高的分类准确率.  相似文献   

14.
15.
文本-图像行人检索旨在从行人数据库中查找符合特定文本描述的行人图像.近年来受到学术界和工业界的广泛关注.该任务同时面临两个挑战:细粒度检索以及图像与文本之间的异构鸿沟.部分方法提出使用有监督属性学习提取属性相关特征,在细粒度上关联图像和文本.然而属性标签难以获取,导致这类方法在实践中表现不佳.如何在没有属性标注的情况下提取属性相关特征,建立细粒度的跨模态语义关联成为亟待解决的关键问题.为解决这个问题,融合预训练技术提出基于虚拟属性学习的文本-图像行人检索方法,通过无监督属性学习建立细粒度的跨模态语义关联.第一,基于行人属性的不变性和跨模态语义一致性提出语义引导的属性解耦方法,所提方法利用行人的身份标签作为监督信号引导模型解耦属性相关特征.第二,基于属性之间的关联构建语义图提出基于语义推理的特征学习模块,所提模块通过图模型在属性之间交换信息增强特征的跨模态识别能力.在公开的文本-图像行人检索数据集CUHK-PEDES和跨模态检索数据集Flickr30k上与现有方法进行实验对比,实验结果表明了所提方法的有效性.  相似文献   

16.
人脸属性识别是计算机视觉和模式识别领域的热门研究课题之一,对人脸图像的分析和理解具有重要的研究意义,同时在图像检索、人脸识别、微表情识别和推荐系统等诸多领域具有广泛的实际应用价值.随着深度学习的快速发展,目前国内外学者已提出许多基于深度学习的人脸属性识别(deep learning based facial attribute recognition, DFAR)方法.首先,阐述人脸属性识别方法的总体流程.接着,按照不同的模型构建方式,分别对基于部分的与基于整体的DFAR方法进行详细地概述与讨论.具体地,对基于部分的DFAR方法按是否采用规则区域定位进行分类,而对基于整体的DFAR方法则分别从基于单任务学习、基于多任务学习的角度进行区分,并对基于多任务学习的DFAR方法根据是否采用属性分组来进一步细分.然后介绍了常用的人脸属性识别数据集与评价指标,并对比与分析了新近提出的DFAR方法的性能.最后对DFAR方法的未来研究趋势进行展望.  相似文献   

17.
作为一种新型的学习范式,泛在学习具有去计算机化的特性。在这种新型的学习环境下,课堂的组织具有分布式松散的特点,学习者不必受制于地理位置空间和时间的限制,从而拥有更好的学习自主性选择权以及更佳的学习体验,但这也对学习者的学习控制提出了更高的要求。文中提出了一种基于模糊多属性决策的学习控制模型,根据备选知识点的掌握程度、重要程度以及与当前知识点的依赖程度给出备选知识点的排序以供学习者选择,引导学习者完成对知识的掌握。  相似文献   

18.
行人再识别是当前图像识别领域的一个重要研究分支,在取得众多研究成果的同时,在实际场景中的应用也存在诸多挑战。摄像设备和拍摄场景的差异,以及穿着、尺度、部分遮挡、姿态等对行人外观的影响,给行人再识别带来较大的困难。为此,提出一种行人再识别方法,通过基于姿态的并行化属性学习任务对行人姿态信息进行标注,并将其作为语义属性融入到行人再识别任务中,降低实际场景中属性缺失对模型的影响,加速训练过程。实验结果表明,该方法在VIPeR数据集上达到了90%的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号