首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
卷积神经网络( CNN)是当前图像识别领域的研究热点,利用预训练的CNN网络提取的图像特征展示出了较强的图像识别能力。主要对比分析了传统视觉特征和CNN视觉特征在基于内容图像检索任务中的性能表现,并指出了一些可以值得深入研究的方向。在两个公开数据库(Pascal Sentence和Pascal VOC 2007)的实验尝试表明CNN视觉特征比传统的视觉特征更适用于图像检索。  相似文献   

2.
针对基于内容的图像检索(CBIR)中图像底层视觉特征与高层语义特征之间存在的"语义鸿沟"问题,提出了一种基于卷积神经网络(CNN)特征和标签信息融合的图像检索算法。首先使用CNN模型提取图像的CNN特征以及标签信息,然后使用余弦距离分别计算这两个特征的相似度,最后将这两个相似度进行加权融合,用作图像检索排序准则。在caltech101和caltech256数据集上分别进行实验,实验结果表明,所提算法加强了图像特征与高层语义的结合,大大提高了图像检索的查准率。  相似文献   

3.
欧拉数是二值图像最重要的特征之一,在模式识别中常被用来作为一种重要的特征矢量.现实的计算机图像处理在计算复杂图像的欧拉数时遇到了一定的困难.因此介绍利用CNN处理器进行CNN通用编程,进行图像欧拉数的提取,既能利用CNN处理器的并行图像处理能力,又兼顾了传统计算机通用编程的灵活性.首先介绍CNN图像处理的原理,以及不同图像识别功能的各种算法元素,然后以图像的欧拉数计算为例说明CNN通用编程在图像识别中的应用.  相似文献   

4.
足迹图像作为犯罪现场的重要痕迹物证之一,在破解串并案上有着不可忽视的作用.传统的足迹图像检索与匹配,需要耗费大量的时间与人力,极大地影响了破案进展.卷积神经网络(CNN)在图像识别与检索上表现出很好的效果.面向公安足迹图像比对实战需求,提出了一种基于卷积神经网络的足迹图像检索与匹配方法,对检索结果设置不同检索区,可以满足不同业务需求.初步实验表明该方法的有效性和实用性.  相似文献   

5.
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.  相似文献   

6.
近年来,细粒度图像识别逐渐成为计算机视觉领域的研究热点.由于不同类别图像间的视觉差异小、语义鸿沟问题严重,传统的基于视觉特征的细粒度图像识别性能往往不尽人意.针对这些挑战,目前许多学者都在研究基于用户点击数据的图像识别.本文围绕点击数据在图像识别中数据预处理、特征提取和模型构建3大模块中的应用,总结了已有的基于点击数据的识别算法及最新的研究进展.  相似文献   

7.
针对真实场景下采集的人脸图像受环境、设备影响导致分辨率低且图像识别率较低的问题,应用深度学习技术,提出一种基于卷积神经网络(CNN)和主成分分析(PCA)的低分辨率人脸识别算法.首先利用图像超分辨率重构将低分辨率图像重建为高分辨率图像;其次利用CNN提取重建后人脸图像特征,对损失函数进行优化;再利用PCA对特征进行降维,得到更优的分类特征;最后利用支持向量机(SVM)、向量间距离等算法筛选出最优人脸分类并计算准确率.实验表明,该算法在LFW和FERET上均取得更好的识别效果,当人脸图像分辨率下降到8×8时,准确率仍能到达94.5%,优于其他算法并且降低了运算时间.  相似文献   

8.
为了改善有限的现勘图像数据量在训练卷积神经网络(convolutional neural network,CNN)时易产生过拟合现象的情况,以及更精准地描述图像内容,提出了基于迁移学习的两种CNN特征级联以及与图像低层特征融合的现勘图像检索算法。首先利用目标图像集对两个预训练CNN模型进行微调,分别提取其fc7层的特征并级联作为图像的高层特征,再与适合本目标图像集的低层特征进行融合,以此作为特征进行图像检索。在现勘图像数据库上的测试结果验证了算法的有效性,并在GHIM-10K数据库进行测试,结果证明了算法的普适性。  相似文献   

9.
针对基于目标的图像检索(OBIR)领域中,传统的视觉关键词方法忽略了局部特征之间的空间关系信息,导致检索准确度不高的问题,提出一种基于多重分割捆绑特征的目标图像检索方法.通过对图像进行多重分割,各分割区块用它所包含的尺度不变特征变换(SIFT)特征集合来描述,生成包含空间关系信息的捆绑特征;根据视觉关键词词库匹配捆绑特征,并提出一种改进的相似性度量方法计算捆绑特征相似度,再将该相似度作为权重融入到视觉关键词方法的向量空间模型中,计算图像相似度并进行排序.结果表明,该方法能够有效利用局部特征之间的空间关系信息,在保证检索效率的同时,显著提高检索准确度.  相似文献   

10.
针对如何有效地利用图像视觉信息与标注信息进行图像聚类的问题,提出了一种基于视觉单词与标注单词共生的聚类算法.在视觉特征空间,采用K-means算法对图像聚类,得到表征图像视觉信息的视觉单词,即聚类中心.在图像标注字空间,计算各聚类中心下标注单词的统计分布,建立视觉单词与标注单词共生矩阵,进而针对图像提取嵌入有视觉信息的标注词特征LDA(latent dirichlet allocation)主题模型作为最终聚类算法完成图像的聚类.通过对Pascal VOC 2007标注图像数据库进行的实验仿真以及对比试验结果表明,基于视觉单词与标注单词共生的聚类算法可以有效地利用图像的视觉信息与标注信息的互补特性,提高聚类算法的性能.  相似文献   

11.
图像物体识别与检测(图像识别)是计算机视觉领域的一个基础性任务.近年来,深度神经网络等推进了图像物体识别的发展.多尺度问题是图像识别的难点问题之一.引入特征金字塔是解决图像多尺度物体识别的有效途径之一.然而,现有基于特征金字塔的方法大多采用自上而下的语义特征信息融合方式,无法提升大尺度物体识别的精确率.为解决该问题,提...  相似文献   

12.
当前视觉词袋(Bag of Visual Word,Bo VW)模型中的视觉词典均由k-means及其改进算法在原始局部特征描述子上聚类生成,但随着图像数据的迅速增长,在原始局部特征空间中进行聚类存在着运行时间较长和占用内存较大的问题.针对着这些问题,提出了一种基于视觉词典和位置敏感哈希的图像检索方法.首先,选择合适的生成二进制哈希码的哈希算法,将局部特征点保持相似性地映射为二进制哈希码.然后,在二进制哈希码上进行k-means,生成视觉词为二进制码的视觉词典.最后,用视觉单词的词频向量表示图像内容,根据词频向量对图像进行检索.在SIFT-1M和Caltech-256数据集上的实验结果表明,本方法可以缩短视觉词典生成的时间,占用更少的存储空间,与传统的基于k-means的视觉词典算法相比,图像检索性能基本不变.  相似文献   

13.
一种语义级文本协同图像识别方法   总被引:1,自引:1,他引:0  
为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题. 考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法. 该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率; 最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别. 在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率. 实验结果表明,文本协同方法能够有效辅助图像识别,具有更好的识别性能.  相似文献   

14.
最新研究表明,互联网上存在的海量近似重复图像可以为解决一些传统上很困难的计算机视觉任务提供新的解决方案。介绍了4个主流的用来进行近似重复图像检索的方法:Hash码,Mean SSIM,SIFT视觉词袋模型(Bo VW)和属性关系图(ARG)。构建了一个包含24 762幅图像的与人物有关的图像数据集,观察数据确定了4种近似重复图像类型。利用该数据集通过实验定量评估了4种近似重复图像检索方法的运行效率和检索精度,最后推荐使用基于SIFT特征的视觉词袋方法来进行面向人物图像的近似重复Web图像检索。  相似文献   

15.
分析了传统关键字检索以及基于小波边界点图像检索方法的缺点,提出了以视觉特征作为图像检索的信息基础,比较了基于小波显著特征点检索技术所具有的优点,及其实现方法.首先,着重讨论了小波显著特征点的提取方法及其表示方法;其次,详细介绍了该新算法在图像检索中的具体应用及优点;最后,介绍了利用基于小波显著特征点进行图像耨检索的具体实例.  相似文献   

16.
提出了基于SURF算法的服装视觉图像检索系统,使用实时、丰富的移动视觉图像进行服装信息的检索.首先对移动端视觉图像进行预处理,然后利用SURF算法完成服装视觉图像特征检测、特征信息描述和特征匹配,从而完成检索.对SURF-36,SURF-64和SURF-100描述向量的匹配效率、匹配准确度等方面进行试验.结果表明,SURF-64能够在效率与准确度之间达到很好的平衡,较快、较好地完成服装视觉图像的检索.  相似文献   

17.
针对数字图书馆中信息资源检索效率低的问题,提出了一种新的文档图像检索算法.首先,根据文档图像自身的特点,结合人眼的视觉特性,提取文档图像中的边缘信息,在此基础上,构造有意义的纹理特征,利用纹理特征来定义文档图像的特征描述符,以描述符为线索,将文档图像的内容特征有机结合,并采用合适的相似性度量准则用于高效的检索.实验结果表明,该算法不仅具有较高的检索效率,而且也降低了传统文档图像检索算法的复杂度.  相似文献   

18.
基于语义分类的图像检索是根据图像的逻辑特征和抽象属性进行检索的技术,给出了一个语义制导的图像检索框架,它在图像、图像语义和视觉特征之间建立了联系,兼顾了基于文本和基于内容的两种图像检索方式.  相似文献   

19.
为了有效地提取图像特征以提高图像检索性能,将具有生物视觉特性的脉冲耦合神经网络(PCNN)和符合人类视觉特性的相位一致性(PC)相结合,提出一种图像检索新方法.首先基于相位一致性,结合非极大值抑制和自适应双阈值法提取出图像的边缘特征,并获取边缘颜色直方图特征;然后对简化PCNN模型进行改进,针对PCNN神经元的链接强度通常为常数的不足,根据相位一致性自适应地调整神经元的链接强度,再利用改进PCNN模型提取图像的特征.最后综合运用基于PCNN的特征和基于相位一致性的特征进行图像检索.实验结果表明:该方法具有颜色和形状的鉴别能力,能获得较好的查准率和查全率.  相似文献   

20.
为了提高Web图像的检索质量,提出了一种融合文本关键字和图像视觉内容的Web图像检索方法.通过改进的图像自动标注模型,将Web图像本身所蕴含的低层视觉特征映射到图像高层语义特征,即图像文本标注;再将词汇相似性计算技术作为语义信息的度量手段,将图像文本标注转换成带有权重的文本标注;利用贝叶斯推理网检索模型内在的多信息融合能力,将带权重的Web图像文本标注特征和Web文档中的文本信息无缝地融合在一起实现Web图像检索.实验结果表明,将Web中的文本关键字和Web图像视觉内容融合起来可在一定程度上提高Web图像检索质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号