期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

骆健蒋旻《计算机应用》2017,37(1):255-261

针对传统的颜色-深度（RGB-D）图像物体识别的方法所存在的图像特征学习不全面、特征编码鲁棒性不够等问题,提出了基于核描述子局部约束线性编码（KD-LLC）的RGB-D图像物体识别方法。首先,在图像块间匹配核函数基础上,应用核主成分分析法提取RGB-D图像的3D形状、尺寸、边缘、颜色等多个互补性核描述子;然后,分别对它们进行LLC编码及空间池化处理以形成相应的图像编码向量;最后,把这些图像编码向量融合成具有鲁棒性、区分性的图像表示。基于RGB-D数据集的仿真实验结果表明,作为一种基于人工设计特征的RGB-D图像物体识别方法,由于所提算法综合利用深度图像和RGB图像的多方面特征,而且对传统深度核描述子的采样点选取和紧凑基向量的计算这两方面进行了改进,使得物体类别识别率达到86.8%,实体识别率达到92.7%,比其他同类方法具有更高的识别准确率。相似文献

2.

RGB-D图像中的分步超像素聚合和多模态融合目标检测

下载免费PDF全文

赵轩郭蔚刘京《中国图象图形学报》2018,23(8):1231-1241

目的受光照变化、拍摄角度、物体数量和物体尺寸等因素的影响,室内场景下多目标检测容易出现准确性和实时性较低的问题。为解决此类问题,本文基于物体的彩色和深度图像组,提出了分步超像素聚合和多模态信息融合的目标识别检测方法。方法在似物性采样（object proposal）阶段,依据人眼对显著性物体观察时先注意其色彩后判断其空间深度信息的理论,首先对图像进行超像素分割,然后结合颜色信息和深度信息对分割后的像素块分步进行多阈值尺度自适应超像素聚合,得到具有颜色和空间一致性的似物性区域;在物体识别阶段,为实现物体不同信息的充分表达,利用多核学习方法融合所提取的物体颜色、纹理、轮廓、深度多模态特征,将特征融合核输入支持向量机多分类机制中进行学习和分类检测。结果实验在基于华盛顿大学标准RGB-D数据集和真实场景集上将本文方法与当前主流算法进行对比,得出本文方法整体的检测精度较当前主流算法提升4.7%,运行时间有了大幅度提升。其中分步超像素聚合方法在物体定位性能上优于当前主流似物性采样方法,并且在相同召回率下采样窗口数量约为其他算法的1/4;多信息融合在目标识别阶段优于单个特征和简单的颜色、深度特征融合方法。结论结果表明在基于多特征的目标检测过程中本文方法能够有效利用物体彩色和深度信息进行目标定位和识别,对提高物体检测精度和检测效率具有重要作用。相似文献

3.

Learning for classification of traffic-related object on RGB-D data

Yingjie?Xia Xingmin?Shi Email author Na?Zhao 《Multimedia Systems》2017,23(1):129-138

In order to detect and recognize the traffic-related object, a learning-based classification approach is proposed on RGB-D data. Since RGB-D data can provide the depth information and thus make it capable of tackling the baffling issues such as overlapping, clustered background, the depth data obtained by Microsoft Kinect sensor is introduced in the proposed method for efficiently detecting and extracting the objects in the traffic scene. Moreover, we construct a feature vector, which combine the histograms of oriented gradients, 2D features and 3D Spin Image features, to represent the traffic-related objects. The feature vector is used as the input of the random forest for training a classifier and classifying the traffic-related objects. In experiments, by conducting efficiency and accuracy tests on RGB-D data captured in different traffic scenarios, the proposed method performs better than the typical support vector machine method. The results show that traffic-related objects can be efficiently detected, and the accuracy of classification can achieve higher than 98 %. 相似文献

4.

多尺度卷积递归神经网络的RGB-D物体识别

骆健蒋旻刘星周龙《计算机应用研究》2017,34(9)

摘要: 为充分利用RGB-D图像提供的潜在特征信息,提出了多尺度卷积递归神经网络算法（Multi-scale Convolutional-Recursive Neural Networks,Ms-CRNN）。该算法对RGB-D图像的RGB图、灰度图、深度图及3D曲面法线图进行不同尺度分块形成多个通道,每个通道与相应尺寸的滤波器卷积,提取的特征图经局部对比度标准化和下采样后作为递归神经网络（Recursive Neural Networks ,RNN）层的输入以得到更加抽象的高层特征。融合后的多尺度特征,由SVM分类器进行分类。基于RGB-D数据集的仿真实验结果表明,综合利用RGB-D图像的多尺度特征,提出的Ms-CRNN算法在物体识别率上达到88.2%,和先前方法相比有了较大的提高。相似文献

5.

3D shape descriptor for object recognition based on Kinect-like depth image

《Image and vision computing》2014,32(4):260-269

相似文献

6.

基于RGB-D融合特征的图像分类

下载免费PDF全文

向程谕王冬丽周彦李雅芳《计算机工程与应用》2018,54(8):178-182

当前经典的图像分类算法大多是基于RGB图像或灰度图像,并没有很好地利用物体或场景的深度信息,针对这个问题,提出了一种基于RGB-D融合特征的图像分类方法。首先,分别提取RGB图像dense SIFT局部特征与深度图Gist全局特征,然后将得到的两种图像特征进行特征融合;其次,使用改进K-means算法对融合特征建立视觉词典,克服了传统K-means算法过度依赖初始点选择的问题,并在图像表示阶段引入LLC稀疏编码对融合特征与其对应的视觉词典进行稀疏编码;最后,利用线性SVM进行图像分类。实验结果表明,所提出的算法能有效地提高图像分类的精度。相似文献

7.

REM记忆模型在图像分类识别中的应用

下载免费PDF全文

姜英王延江《智能系统学报》2017,12(3):310-317

尝试将认知心理学中的记忆模型与图像学习识别联系在一起,研究基于REM（retrieving effective from memory）记忆模型的视觉图像存储与识别方法。采用方向梯度直方图（HOG）和局部二进模式（LBP）生成图像特征向量,并对每个特征向量中的每一个分量按概率进行复制,允许错误复制,最后采用Bayesian决策计算被探测图像特征向量与已学习图像集特征向量的平均似然比值,根据该值判断被探测图像是否已学习过。实验结果表明,提出的算法不仅对同一个物体的小幅度旋转图像具有很好的识别效果,同时对同一类别物体图像识别也具有较好的效果,而且其虚报率远远低于其他识别方法。相似文献

8.

基于最大熵原理的空间特征选择方法 总被引：10，自引：0，他引：10

下载免费PDF全文

宋国杰唐世渭杨冬青王腾蛟《软件学报》2003,14(9):1544-1550

特征选择在模式识别和数据挖掘等领域都有十分广泛的应用.然而,当涉及空间数据时,由于传统特征选择方法没有很好地考虑数据的空间特性,所以会导致特征选择结果性能下降.从空间数据本身的特性出发,提出一种特征选择方法MEFS(maximum entropy feature selection).MEFS在基于最大熵原理的基础上,运用互信息和Z-测试技术,采用两步方法进行空间特征选择.第1步,空间谓词选择;第2步,选择与每个空间谓词对应的相关属性集.最后,分别对MEFS方法和RELIEF方法以及基于MEFS的分类方法与决策树算法ID3分别进行了实验比较.实验结果表明,MEFS方法不仅可以节约特征提取和分类时间,而且也极大地提高了分类质量. 相似文献

9.

采用精选Gabor小波和SVM分类的物体识别 总被引：3，自引：0，他引：3

沈琳琳纪震《自动化学报》2009,35(4):350-355

提出了一种基于Gabor小波和支持向量机的物体识别通用框架. 在该框架中, 特征抽取采用选取的Gabor小波在物体的最佳位置卷积实现, 而分类则通过支持向量机实现. 相比传统的基于Gabor特征的识别系统, 该方法能够同时达到准确而快速的分类目的. 本论文成功地将该框架应用于两个实际的物体识别例子: 物体/非物体分类和人脸识别. 实验结果证明了所提出的方法相对于其它方法的优越性. 相似文献

10.

Kinect 下深度信息获取技术及其在三维目标识别中的应用综述

尹潘龙徐光柱雷帮军曹维华《集成技术》2013,2(6):94-99

微软公司 2010 年推出的 Kinect 深度传感器能够同步提供场景深度和彩色信息,其应用的一个关键领域就是目标识别。传统的目标识别大多限制在特殊的情形,如：手势识别、人脸识别,而大规模的目标识别是近年来的研究趋势。通过 Kinect 得到的 RGB-D 数据集多为室内和办公环境下获取的多场景、多视角、分目标类型的数据集,为大规模的目标识别算法设计提供了学习基础。同时,Kinect 获取的深度信息为目标识别提供了强有力的线索,利用深度信息的识别方法较以前的方法具有无法比拟的优势,大大地提高了识别的精度。文章首先对 Kinect 的深度获取技术做了详细介绍;其次对现有的 3D 目标识别方法进行综述,接着对已有的 3D 测试数据集进行分析和比较;最后对文章进行小结以及对未来 3D 目标识别算法和 3D 测试数据集的发展趋势作了简单的阐述。相似文献

11.

Feature extraction in Brazilian Sign Language Recognition based on phonological structure and using RGB-D sensors

《Expert systems with applications》2014,41(16):7259-7271

In contrast to speech recognition, whose speech features have been extensively explored in the research literature, feature extraction in Sign Language Recognition (SLR) is still a very challenging problem. In this paper we present a methodology for feature extraction in Brazilian Sign Language (BSL, or LIBRAS in Portuguese) that explores the phonological structure of the language and relies on RGB-D sensor for obtaining intensity, position and depth data. From the RGB-D images we obtain seven vision-based features. Each feature is related to one, two or three structural elements in BSL. We investigate this relation between extracted features and structural elements based on shape, movement and position of the hands. Finally we employ Support Vector Machines (SVM) to classify signs based on these features and linguistic elements. The experiments show that the attributes of these elements can be successfully recognized in terms of the features obtained from the RGB-D images, with accuracy results individually above 80% on average. The proposed feature extraction methodology and the decomposition of the signs into their phonological structure is a promising method to help expert systems designed for SLR. 相似文献

12.

具有特征选择的多源自适应分类框架

黄学雨徐浩特陶剑文《计算机应用》2005,40(9):2499-2506

对于现有的多源自适应学习方案无法有效区分多个源域中的有用信息并迁移至目标域的问题，提出一种具有特征选择的多源自适应分类框架（MACFFS），并将特征选择和共享特征子空间学习整合到统一框架中进行联合特征学习。具体来说，MACFFS将来自多个源域的特征数据投影至不同的潜在空间中来学习得到多个源域分类模型，实现目标域的分类。然后，将得到的多个分类结果进行整合用于目标域分类模型的学习。此外，框架还利用L_2，1范数稀疏回归代替传统的基于L₂范数的最小二乘回归来提高鲁棒性。最后，把多种现有方法在两项任务中与MACFFS进行实验比较分析。实验结果表明，与现有方法中表现最好的DSM相比，MACFFS节省了接近1/4的计算时间，并且提升了大约2%的识别率。总的来说，MACFFS结合了机器学习、统计学习等相关知识，为多源自适应方法提供了一个新的思路，且该方法在现实场景下的识别应用中比现有方法具有更好的性能。相似文献

13.

具有特征选择的多源自适应分类框架

黄学雨徐浩特陶剑文《计算机应用》2020,40(9):2499-2506

对于现有的多源自适应学习方案无法有效区分多个源域中的有用信息并迁移至目标域的问题,提出一种具有特征选择的多源自适应分类框架（MACFFS）,并将特征选择和共享特征子空间学习整合到统一框架中进行联合特征学习。具体来说,MACFFS将来自多个源域的特征数据投影至不同的潜在空间中来学习得到多个源域分类模型,实现目标域的分类。然后,将得到的多个分类结果进行整合用于目标域分类模型的学习。此外,框架还利用L_2,1范数稀疏回归代替传统的基于L₂范数的最小二乘回归来提高鲁棒性。最后,把多种现有方法在两项任务中与MACFFS进行实验比较分析。实验结果表明,与现有方法中表现最好的DSM相比,MACFFS节省了接近1/4的计算时间,并且提升了大约2%的识别率。总的来说,MACFFS结合了机器学习、统计学习等相关知识,为多源自适应方法提供了一个新的思路,且该方法在现实场景下的识别应用中比现有方法具有更好的性能。相似文献

14.

基于张量分解融合RGB-D图像的物体识别

下载免费PDF全文

余霆嵩文元美凌永权《计算机工程与应用》2019,55(2):174-178

为了充分利用RGB-D图像的深度图像信息，提出了基于张量分解的物体识别方法。首先将RGB-D图像构造成一个四阶张量，然后将该四阶张量分解为一个核心张量和四个因子矩阵，再利用相应的因子矩阵将原张量进行投影，获得融合后的RGB-D数据，最后输入到卷积神经网络中进行识别。RGB-D数据集中三组相似物体的识别结果表明，利用张量分解融合RGB-D图像的物体识别准确率高于未采用张量分解的物体识别准确率，并且单一错分实例的准确率最高可提升99%。相似文献

15.

跨模态交互融合与全局感知的RGB-D显著性目标检测

孙福明胡锡航武景宇孙静王法胜《软件学报》2024,35(4):1899-1913

近年来, RGB-D显著性检测方法凭借深度图中丰富的几何结构和空间位置信息, 取得了比RGB显著性检测模型更好的性能, 受到学术界的高度关注. 然而, 现有的RGB-D检测模型仍面临着持续提升检测性能的需求. 最近兴起的Transformer擅长建模全局信息, 而卷积神经网络(CNN)擅长提取局部细节. 因此, 如何有效结合CNN和Transformer两者的优势, 挖掘全局和局部信息, 将有助于提升显著性目标检测的精度. 为此, 提出一种基于跨模态交互融合与全局感知的RGB-D显著性目标检测方法, 通过将Transformer网络嵌入U-Net中, 从而将全局注意力机制与局部卷积结合在一起, 能够更好地对特征进行提取. 首先借助U-Net编码-解码结构, 高效地提取多层次互补特征并逐级解码生成显著特征图. 然后, 使用Transformer模块学习高级特征间的全局依赖关系增强特征表示, 并针对输入采用渐进上采样融合策略以减少噪声信息的引入. 其次, 为了减轻低质量深度图带来的负面影响, 设计一个跨模态交互融合模块以实现跨模态特征融合. 最后, 5个基准数据集上的实验结果表明, 所提算法与其他最新的算法相比具有显著优势. 相似文献

16.

Face recognition based on Kinect

Billy Y. L. Li Ajmal S. Mian Wanquan Liu Aneesh Krishna 《Pattern Analysis & Applications》2016,19(4):977-987

In this paper, we present a new algorithm that utilizes low-quality red, green, blue and depth (RGB-D) data from the Kinect sensor for face recognition under challenging conditions. This algorithm extracts multiple features and fuses them at the feature level. A Finer Feature Fusion technique is developed that removes redundant information and retains only the meaningful features for possible maximum class separability. We also introduce a new 3D face database acquired with the Kinect sensor which has released to the research community. This database contains over 5,000 facial images (RGB-D) of 52 individuals under varying pose, expression, illumination and occlusions. Under the first three variations and using only the noisy depth data, the proposed algorithm can achieve 72.5 % recognition rate which is significantly higher than the 41.9 % achieved by the baseline LDA method. Combined with the texture information, 91.3 % recognition rate has achieved under illumination, pose and expression variations. These results suggest the feasibility of low-cost 3D sensors for real-time face recognition. 相似文献

17.

Recent advances in 3D object detection based on RGB-D: A survey

《Displays》2021

3D object detection is a critical part of environmental perception systems and one of the most fundamental tasks in understanding the 3D visual world, which benefit a series of downstream real-world applications. RGB-D images include object texture and semantic information, as well as depth information describing spatial geometry. Recently, numerous 3D object detection models for RGB-D images have been proposed with excellent performance, but summaries in this area are still absent. To stimulate future research, this paper provides a detailed analysis of current developments in 3D object detection methods for RGB-D images to motivate future research. It covers three major parts, including background on 3D object detection, RGB-D data details, and comparative results of state-of-the-art methods on several publicly available datasets, with an emphasis on contributions, design ideas, and limitations, as well as insightful observations and inspiring future research directions. 相似文献

18.

基于环查询和通道注意力的点云分类与分割

下载免费PDF全文

刘玉珍李楠陶志勇《图学学报》2022,43(4):616-623

点云数据的特征处理是机器人、自动驾驶等领域中三维物体识别技术的关键组成部分,针对点云局部特征信息重复提取、点云物体整体几何结构缺乏识别等问题,提出一种基于环查询和通道注意力的点云分类与分割网络。首先将单层环查询和特征通道注意力机制进行结合,减少局部信息冗余并加强局部特征;然后计算法线变化识别出物体边缘、拐角区域的高响应点,并将其法线特征加入全局特征表示中,加强物体整体几何结构的识别。在ModelNet40和ShapeNet Part数据集上与多种点云网络进行比较,实验结果表明,该网络不仅有较高的点云分类与分割精度,同时在训练时间和内存占用等方面也优于其他方法,此外对于不同输入点云数量具有较强鲁棒性。因此该网络是一种有效、可行的点云分类与分割网络。相似文献

19.

基于非对称跨模态融合的RGB-D显著目标检测

于明邢章浩刘依《控制与决策》2023,38(9):2487-2495

目前大多数RGB-D显著目标检测方法在RGB特征和Depth特征的融合过程中采用对称结构,对两种特征进行相同的操作,忽视了RGB图像和Depth图像的差异性,易造成错误的检测结果.针对该问题,提出一种基于非对称结构的跨模态融合RGB-D显著目标检测方法,利用全局感知模块提取RGB图像的全局特征,并设计了深度去噪模块滤除低质量Depth图像中的大量噪声;再通过所提出的非对称融合模块,充分利用两种特征间的差异性,使用Depth特征定位显著目标,用于指导RGB特征融合,补足显著目标的细节信息,利用两种特征各自的优势形成互补.通过在4个公开的RGB-D显著目标检测数据集上进行大量实验,验证所提出的方法优于当前的主流方法. 相似文献

20.

基于卷积递归神经网络和核超限学习机的3D目标识别^*

刘阳阳张骏高欣健张旭东高隽《模式识别与人工智能》2017,30(12):1091-1099

针对大规模RGB-D数据集中存在的深度线索质量和非线性模型分类问题,提出基于卷积递归神经网络和核超限学习机的3D目标识别方法.该方法引入深度图编码算法,修正原始深度图中存在的数值丢失和噪声问题,将点云图统一到标准角度,形成深度编码图,并结合原始深度图作为新的深度线索.利用卷积递归神经网络学习不同视觉线索的层次特征,融入双路空间金字塔池化方法,分别处理多线索特征.最后,构建基于核方法的超限学习机作为分类器,实现3D目标识别.实验表明,文中方法有效提高3D目标识别率和分类效率. 相似文献