首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
吴健康  高枫 《机器人》1990,12(5):35-39
三维物体的表达和识别是图象理解和场景分析的核心问题,三维模型在三维物体的识别和场景分析中具有十分重要的作用.三维模型应该是以物体为中心的,能够提供该场景的所有有用信息.物体的大小,形状及朝向应均可从该模型中提取得到.本文提出了一种新的三维物体模型——广义的以物体为中心的行程编码.它包括物体的GORC物理数据结构,详细的形状描述和抽象描述.物体的高层次的表达可以通过以GORC编码的物理数据直接提取得到.三维的GORC是二维的以物体为中心的行程编码在三维上的推广,它兼有物体的体积表达和表面表达的优点.三维物体的GORC模型可以很容易地由其深度信息构造得出,基于GORC的投影运算,图象代数运算以及特征提取均可非常有效地实现.  相似文献   

2.
三维物体识别及姿态测定的推理系统   总被引:1,自引:1,他引:0  
王建刚  姚筱亦 《机器人》1994,16(2):104-113
本文介绍了三维物体识别及姿态测定的一种新技术,从物体空间域模型出发,通过约束推理及几何推理,在物体三维信息部分给定的条件下,推断预测图象模型,并通过实测的图象数据反馈,推断出隐含在图象中未给定的三维信息,最终实现三维物体识别及姿态测定。整个系统在VICOM机上用C语言完成。  相似文献   

3.
袁梅  王晓军 《计算机学报》1994,17(A00):11-19
本文针对三维物体识别中的距离图象分割问题,提出了一个新的边与区域混合的鲁棒算法;算法包括两个步骤,首先使用一种自适应加权拟合技术对原始图象进行平滑以获取边与面的初始估计,然后是一个基于边与区域混合的细分割过程以获得边与面的精确描述,场景实验以及与已有算法进行的比较实验充分证明,该技术明显优于文献中已有的方法,具有良好的适用性。  相似文献   

4.
研究三维物体识别问题,摄像机从不同角度拍摄三维物体,获取的三维物体图像变化比较大,传统方法采用单一特征或简单多特征难以正确描述三维物体,导致三维物体识别的准确率较低.为了提高三维物体识别准确率,提出一种多特征和支持向量机相融合的三维物体识别方法.首先分别提取三维物体的颜色特征、纹理特征和不变矩特征,然后采用主成分分析消除各特征间的冗余信息,最后采用支持向量机建立三维物体识别模型.采用三维物体图像数据库COIL-100进行测试实验,结果表明,相对于传统识别方法,改进方法不仅提高了三维物体识别准确率,同时加快识别速度,为三维物体识别提供了一种新的识别方法.  相似文献   

5.
基于模型的三维物体识别   总被引:2,自引:0,他引:2  
实现了一个完整的基于模型的三维物体识别系统,它可识别灰度图象中包含的物 体,如对遮挡加以限制,还可识别被遮挡的物体.该系统能实现物体的自动建模,也可先定性 识别某一物体的立体图对以获取高层知识,然后在高层知识的指导下准确地匹配立体图对中 相对应的特征.此外,还提出了利用最能表示物体特征的表面(特征面)来识别物体的方法,以 提高系统抗噪声的能力.大量实验证明,该系统具有相当的稳健性.  相似文献   

6.
基于SIFT和Hu特征融合的单目视觉识别算法研究   总被引:1,自引:0,他引:1  
研究了机器视觉技术在三维物体识别定位问题中的应用。利用Visual C++编程软件建立了摄像机标定界面,实现对摄像机进行快速标定的功能。提出了一种SIFT特征和Hu不变矩融合算法,该算法是一种融合了局部特征和全局特征的算法。其中全局特征反映了对三维物体图像的整体信息进行粗略匹配和定位,局部特征可以在全局特征中进行更准确特征匹配,该算法对伸缩、旋转和平移等有很好的抵抗能力。实验结果表明,该视觉算法可以有效解决三维物体匹配问题,并且有效提高了系统的识别速率和效率,满足物体识别的目的。  相似文献   

7.
《传感器与微系统》2019,(9):115-117
针对现有的基于全局特征的三维物体识别方法和基于局部特征的三维物体识别方法在有遮挡和混叠场景中识别效果均不理想的问题,提出了一种基于点对特征的三维点云匹配算法。利用模型上的所有点对特征来完成全局模型描述构建,并在减少的二维空间上,利用快速投票方案,在局部对模型点云和场景点云进行匹配,从而恢复模型在场景中的全局姿态。实验结果表明:该算法在有遮挡和混叠的场景中识别效果比较理想。  相似文献   

8.
仅从三维模型的几何信息推测模型正朝向是一项具有挑战性的工作.文中针对三维人造物体模型,提出了一种全自动的正朝向识别算法.首先分析模型本身面片朝向、模型对称性及模型三维凸包的面片朝向,找出若干组朝向三元组,使得组内3个朝向两两正交;然后将每组朝向三元组构成的标架旋转到标准坐标系,通过对模型面片的法向和面积进行统计,投票筛选出唯一标架,使得模型能够与标准坐标系对齐;最后基于静力学平衡原理、模型可见性等准则,从标准坐标系的6个候选朝向中选取正确的正朝向.在一个三维模型数据库上进行实验的结果显示,该算法可以很好地处理绝大部分模型,包括目前最好的非监督方法不能处理的模型.  相似文献   

9.
结合HSL模型与傅里叶描述子的三维彩色物体识别   总被引:1,自引:0,他引:1  
目标物识别是机器人导航中重要的一步,现存的方法大多对于场景中的彩色物体仅采用颜色分割,或者转化为灰度图进行识别,不能满足彩色物体识别的需要.提出在基于HSL模型颜色分割的基础上,结合傅里叶算子对轮廓特征识别的优势,先用三维目标各个角度成像的傅里叶描述子建立分类器,再对三维物体的二维成像进行轮廓特征识别,并在颜色分割的过程中采用了快速算法.实验表明,物体测试集的识别率达到了73.3%,可应用于对实时性要求比较高的彩色物体智能识别系统.  相似文献   

10.
物体拍摄环境具有测量数据量大、物体外轮廓信息复杂等特点,采用当前方法能够获得物体精确的三维点云数据,但缺乏颜色和纹理信息,导致物体重构精度不高,真实感较差;为此,提出一种基于三维激光扫描的物体重构建模方法;该方法通过三维激光扫描技术获取物体点云数据,采用显式的欧拉积分方法对物体整个三维曲面进行平滑,依据三角生长法进行物体三维空间三角划分,将物体网格顶点向球面进行映射,由此构造物体三角网格模型,通过迭代最近点算法对物体非同步点云数据初步匹配结果进行精确配准,利用最近点搜索算法将经多视图立体视觉算法优化后的物体颜色信息和三维点云数据坐标相融合;实验结果表明,所提方法可以快速精确地建立物体三维重构模型,验证了所提方法的可行性。  相似文献   

11.
目的 视觉目标的形状特征表示和识别是图像领域中的重要问题。在实际应用中,视角、形变、遮挡和噪声等干扰因素造成识别精度较低,且大数据场景需要算法具有较高的学习效率。针对这些问题,本文提出一种全尺度可视化形状表示方法。方法 在尺度空间的所有尺度上对形状轮廓提取形状的不变量特征,获得形状的全尺度特征。将获得的全部特征紧凑地表示为单幅彩色图像,得到形状特征的可视化表示。将表示形状特征的彩色图像输入双路卷积网络模型,完成形状分类和检索任务。结果 通过对原始形状加入旋转、遮挡和噪声等不同干扰的定性实验,验证了本文方法具有旋转和缩放不变性,以及对铰接变换、遮挡和噪声等干扰的鲁棒性。在通用数据集上进行形状分类和形状检索的定量实验,所得准确率在不同数据集上均超过对比算法。在MPEG-7数据集上精度达到99.57%,对比算法的最好结果为98.84%。在铰接和射影变换数据集上皆达到100%的识别精度,而对比算法的最好结果分别为89.75%和95%。结论 本文提出的全尺度可视化形状表示方法,通过一幅彩色图像紧凑地表达了全部形状信息。通过卷积模型既学习了轮廓点间的形状特征关系,又学习了不同尺度间的形状特征关系。本文方法在视角变化、局部遮挡、铰接变形和噪声等干扰下能保持较高的识别正确率,可应用于图像采集干扰较多以及红外或深度图像的目标识别,并适用于大数据场景下的识别任务。  相似文献   

12.
为了挖掘人脸稀疏表示的高阶结构信息,从而获得更精确的人脸分类判别信息,提出一种新的基于高阶结构约束的稀疏表示的人脸识别算法。在提取人脸图像的Gabor特征后,选取适当的训练样本构建稀疏线性编码模型,利用样本特征间的高阶结构信息约束和最优化求解测试样本的稀疏系数,将稀疏系数作为最终特征对人脸进行识别,实验结果表明,与结构约束稀疏表示和非结构约束稀疏表示的方法比较,人脸的高阶结构稀疏表示能显著提高人脸的识别准确率。  相似文献   

13.
Synthetic aperture radar (SAR) target images suffer from target aspect angle sensitivity. To overcome the obstacle that seriously influences recognition performance, a label-dependent sparse representation (LSR) algorithm is proposed to realize SAR target configuration recognition in the sparse domain. The label of the training sample is embedded into the sparse representation (SR) model, and dictionaries are constructed individually to eliminate disturbances. LSR is implemented according to a statistical model based on the Gaussian mixture distribution (GMD). Experiments are conducted on a wide range of moving and stationary target acquisition and recognition (MSTAR) databases. The experimental results demonstrate the effectiveness of the proposed algorithm, which outperforms other existing algorithms in terms of recognition accuracy.  相似文献   

14.
三维模型的深度特征表示是三维目标识别和三维模型语义分割的关键和前提,在 机器人、自动驾驶、虚拟现实、遥感测绘等领域有着广泛的应用前景。然而传统的卷积神经网 络需要以规则化的数据作为输入,对于点云数据需要转换为视图或体素网格来处理,过程复杂 且损失了三维模型的几何结构信息。借助已有的可以直接处理点云数据的深度网络,针对产生 的特征缺少局部拓扑信息问题进行改进,提出一种利用双对称函数和空间转换网络获得更鲁棒、 鉴别力更强的特征。实验表明,通过端到端的方式很好地解决缺少局部信息问题,在三维目标 识别、三维场景语义分割任务上取得了更好的实验效果,并且相比于 PointNet++在相同精度的 情况下训练时间减少了 20%。  相似文献   

15.
In this paper, an efficient method for human facial expression recognition is presented. We first propose a representation model for facial expressions, namely the spatially maximum occurrence model (SMOM), which is based on the statistical characteristics of training facial images and has a powerful representation capability. Then the elastic shape-texture matching (ESTM) algorithm is used to measure the similarity between images based on the shape and texture information. By combining SMOM and ESTM, the algorithm, namely SMOM-ESTM, can achieve a higher recognition performance level. The recognition rates of the SMOM-ESTM algorithm based on the AR database and the Yale database are 94.5% and 94.7%, respectively.  相似文献   

16.
A spherical representation for recognition of free-form surfaces   总被引:3,自引:0,他引:3  
Introduces a new surface representation for recognizing curved objects. The authors approach begins by representing an object by a discrete mesh of points built from range data or from a geometric model of the object. The mesh is computed from the data by deforming a standard shaped mesh, for example, an ellipsoid, until it fits the surface of the object. The authors define local regularity constraints that the mesh must satisfy. The authors then define a canonical mapping between the mesh describing the object and a standard spherical mesh. A surface curvature index that is pose-invariant is stored at every node of the mesh. The authors use this object representation for recognition by comparing the spherical model of a reference object with the model extracted from a new observed scene. The authors show how the similarity between reference model and observed data can be evaluated and they show how the pose of the reference object in the observed scene can be easily computed using this representation. The authors present results on real range images which show that this approach to modelling and recognizing 3D objects has three main advantages: (1) it is applicable to complex curved surfaces that cannot be handled by conventional techniques; (2) it reduces the recognition problem to the computation of similarity between spherical distributions; in particular, the recognition algorithm does not require any combinatorial search; and (3) even though it is based on a spherical mapping, the approach can handle occlusions and partial views  相似文献   

17.
We describe a flexible model for representing images of objects of a certain class, known a priori, such as faces, and introduce a new algorithm for matching it to a novel image and thereby perform image analysis. The flexible model, known as a multidimensional morphable model, is learned from example images of objects of a class. In this paper we introduce an effective stochastic gradient descent algorithm that automatically matches a model to a novel image. Several experiments demonstrate the robustness and the broad range of applicability of morphable models. Our approach can provide novel solutions to several vision tasks, including the computation of image correspondence, object verification and image compression.  相似文献   

18.
三维物体识别研究进展   总被引:19,自引:2,他引:17       下载免费PDF全文
出于工业和医疗等领域大量现实应用的需要,如今三维物体识别已成为一个很活跃的研究领域。一般来说,三维物体识别系统可以通过两个阶段的处理来完成三维物体的识别和定位,首先用传感器获取的场景输入数据来得到场景的表达;然后将它与数据库中存储的物体表达相匹配。为了推动该领域研究进一步发展,因而对近10a年中该识别过程中必须解决的感传器类型、三维物体表达方法和匹配策略等3个方面问题的研究成果进行了综述,对主要方法进行分类和总结;并提出了一些三维视觉系统中还需要深入研究的问题,包括对所研究物体形状的限制、复杂背景的影响和表达以及识别中的“整体和局部”的矛盾等。  相似文献   

19.
Computing moments on images is very important in the fields of image processing and pattern recognition. The non-symmetry and anti-packing model (NAM) is a general pattern representation model that has been developed to help design some efficient image representation methods. In this paper, inspired by the idea of computing moments based on the S-Tree coding (STC) representation and by using the NAM and extended shading (NAMES) approach, we propose a fast algorithm for computing lower order moments based on the NAMES representation, which takes O(N) time where N is the number of NAM blocks. By taking three idiomatic standard gray images ‘Lena’, ‘F16’, and ‘Peppers’ in the field of image processing as typical test objects, and by comparing our proposed algorithm with the conventional algorithm and the popular STC representation algorithm for computing the lower order moments, the theoretical and experimental results presented in this paper show that the average execution time improvement ratios of the proposed NAMES approach over the STC approach, and also the conventional approach are 26.63%, and 82.57% respectively while maintaining the image quality.  相似文献   

20.
骆健  蒋旻 《计算机应用》2017,37(1):255-261
针对传统的颜色-深度(RGB-D)图像物体识别的方法所存在的图像特征学习不全面、特征编码鲁棒性不够等问题,提出了基于核描述子局部约束线性编码(KD-LLC)的RGB-D图像物体识别方法。首先,在图像块间匹配核函数基础上,应用核主成分分析法提取RGB-D图像的3D形状、尺寸、边缘、颜色等多个互补性核描述子;然后,分别对它们进行LLC编码及空间池化处理以形成相应的图像编码向量;最后,把这些图像编码向量融合成具有鲁棒性、区分性的图像表示。基于RGB-D数据集的仿真实验结果表明,作为一种基于人工设计特征的RGB-D图像物体识别方法,由于所提算法综合利用深度图像和RGB图像的多方面特征,而且对传统深度核描述子的采样点选取和紧凑基向量的计算这两方面进行了改进,使得物体类别识别率达到86.8%,实体识别率达到92.7%,比其他同类方法具有更高的识别准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号