首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
基于视图的三维重建旨在从二维图像恢复出其对应的三维形状。现有方法主要通过编码器-解码器结构,结合二元交叉熵函数及其变形,完成三维重建,取得较好的重建结果。然而,编码器在编码过程中缺乏对输入视图的结构感知能力,造成重建的三维模型几何细节不准确;以二元交叉熵函数为主的损失函数在体素分布不均衡的情况下,目标感知能力较差,导致其重建结果存在断裂、缺失等不完整性问题。针对此类问题,提出了一种具有结构和目标感知能力的三维重建网络(ST-Rec3D),以单视图或多视图为输入,由粗到细地重建出三维模型;结合注意力机制提出了一种具有空间结构感知能力的编码器,即结构编码器,以充分捕捉输入视图中的空间结构信息,有效感知重建物体的几何细节;将IoU损失引入到三维体素模型重建中,在体素分布不均衡的情况下,精准感知目标物体,确保重建物体的完整性和准确性。在ShapeNet和Pix3D数据集上的对比结果表明,ST-Rec3D在单视图和多视图上重建的三维模型的完整性和准确性均优于当前方法。  相似文献   

2.
基于体素表示的三维物体重建计算代价会随着体素分辨率的增加呈立方增长.为了缓解这一问题,提出组件感知的三维物体重建方法,将三维物体分解成多个组件,通过预测组件几何结构和组装组件的方式重建三维物体,从而将高分辨率三维物体的重建问题分解成一系列低分辨率组件的重建问题.组件感知的三维物体重建方法使用组件位置预测模块预测所有组件的位置;使用组件特征提取模块融合组件表观特征与组件几何特征生成组件联合特征;使用组件几何结构重建模块根据组件联合特征重建组件的几何形状;最后将所有组件按其位置信息组装成高分辨率的三维物体.实验使用ShapeNet数据集在一个拥有12 GB内存的NVIDIA 1080 Maxwell GPU上进行.对比方法包括一个基于八叉树的高分辨率重建方法、一个基于LSTM的低分辨率重建方法和一个使用编码器-解码器架构的Baseline方法.高分辨率重建结果显示,组件感知的三维物体重建方法能够以较小的计算代价取得满意的高分辨率三维物体重建精度.在低分辨率重建实验上,该方法也取得了更高的重建精度,在13个类别上的平均精度达到了0.618.  相似文献   

3.
为了解决由原始点云数据局部密度稀疏、不均匀或者法向量错误等制约因素引起的重建网格质量问题,利用对抗神经网络中权重共享的特性和对抗的训练过程,提出一种基于对抗网络的点云三维重建方法。首先,利用预测器对网格模型边的偏移量进行预测,从而得到每一个顶点的位移,并进行拓扑保持的顶点重定向,得到新的网格模型。然后,利用判别器中的点云分类器,提取原始点云数据和网格模型表面采样点集的高维特征,并基于高维特征进行空间感知的判别,用于区分原始点云与采样点集数据。最后,使用对抗的训练方式将预测器与判别器的输出数据关联起来,通过多次迭代优化网络模型,从而得到满足点云空间特征的三维网格模型。在不同的点云数据集上进行实验,并使用MeshLab软件进行效果展示,结果表明,该方法能够重建出满足点云空间信息的三维网格模型,同时能够解决粗劣的点云数据引起的网格质量问题。  相似文献   

4.
以菱形十二面体为体素构成的三维面心立方(Face-Centered Cubic,FCC)网格是六角网格在三维的一种推广,直线生成算法在三维图形和图像应用中是一个非常重要和基础的算法.文中首先研究了二维六角网格下基于附属菱形空间的直线生成算法,然后将其推广至三维FCC网格,得到了一种FCC网格下的直线生成算法,该算法在三维方形网格下的Bresenham算法的基础上,利用附属平行六面体空间的平行六面体与FCC网格空间的体素之间的一一对应关系生成直线.该算法应用简单的判断公式,一步最多可生成3个体素,且只涉及到整数运算,因而没有累计误差.  相似文献   

5.
为了能够从密集点云直接获得四边形网格,而不需要通过三角形网格重构获得,提出针对密集点直接构造的四边形网格生成算法.首先进行点云数据体素化得到体素模型,建立体素和点云的索引关系,并对体素做精细化操作,以提高映射效果;然后通过体素模型外表面的顶点与原始点云的映射得到四边形网格模型,并对四边形网格进行优化.在斯坦福的数据集上进行实验,并使用MeshLab软件进行效果展示,结果表明,该算法可以基于密集点云直接生成四边形网格模型,同时可以通过调整体素大小来自适应地改变算法效率和四边形网格的大小.  相似文献   

6.
一种三维实体模型的离散表示方法   总被引:2,自引:0,他引:2  
在计算机中,传统的三维几何模型只能描述表面数据,要描述模型内部属性时,这种模型显得无能为力。体图形学(VolumeGraphics,简称VG)是计算机图形学中新发展起来的一个重要分支。三维模型的体素表示是体图形学中的基本方法,体素化是体图形学中一个不可缺少的前处理过程,其任务是把物体的表面几何形式表示离散成最接近该物体的体素表示形式,产生体数据集。该文将基于Z-buffer扩展的深度缓存原理扩展到x,y,z三个方向上,实现了复杂三维网格模型的体素化表示。实验表明该算法具有很高的执行效率,并且算法的复杂度不依赖于模型的复杂度。  相似文献   

7.
针对传统手工修复缺损牙治疗周期长,牙科CAD系统修复缺乏个性化的问题,提出一种结合条件生成式对抗网络和高维特征损失约束的全冠咬合面个性化设计方法.首先,通过计算三维牙齿曲面深度信息,获取患牙预备体及其他条件模型的二维深度图并构建数据集;其次,以对颌牙条件数据作为咬合关系约束,同名对称牙冠数据作为形态辅助信息,利用构建的网络模型实现预备体数据向目标牙冠数据的空间映射;然后,将生成的牙冠深度图重建为三维网格模型,完成缺损牙的形态重建;最后,选取部分患牙模型进行实验测试,分析了不同约束条件对生成的牙冠咬合面形态的影响,对比了不同修复方法重建牙冠的质量.结果表明,该方法能够高效、个性化地重建全冠咬合面的解剖特征,满足缺损牙功能性修复的设计要求.  相似文献   

8.
三维地质模型主要包含地质构造模型和地质属性模型。提出一种局部映射-边界控制的曲面三角化网格模型构建算法,与映射法相比,减少三维空间点映射到二维平面的计算过程,避免因多点到一点的映射关系而生成错误的三角化网格模型。基于地质测量数据特点,原始地质数据经处理后采用点集合形式表示,基于点集数据构建三维三角化网格模型,模拟地质界面的展布形态,控制三角网格质量。采用两种网格边界控制方法,在有边界约束数据和无边界约束数据条件下均能自动更新地质界面三角化网格模型边界。基于断层点数据集测试并展示算法构建的三维三角化网格模型可视化效果,通过断层面三角化网格模型能够反映断层面之间空间位置关系。  相似文献   

9.
基于图像的树类物体的三维重建   总被引:21,自引:0,他引:21  
树类物体的三维重建一直是人们很感兴趣的一个研究内容。该文利用基于图像的建模技术,实现了一个从双视点图像重建树木三维模型的系统,提出了一个自动获取树木二维主干骨架的方案,实现了二维骨架点的对应关系求解,三维骨架点的重建、简化及树表面网格的生成。实验结果表明该文提出的方法确实可行、有效。  相似文献   

10.
近年来基于二维图像的三维建模方法取得了快速发展,但就人体建模而言,由于摄像头采集到的二维人体图像包含衣物、发丝等大量的纹理信息,而像虚拟试衣等相关应用需要将人体表面的衣物褶皱等纹理信息去除,同时考虑到裸体数据采集侵犯了用户的隐私,因此提出一种基于二维点云图像到三维人体模型的新型建模方法。与摄像机等辅助设备进行二维图片数据集的采集不同,该算法的输入是由三维人体点云模型以顶点模式绘制的二维点云渲染图。主要工作是建立一个由二维点云图和相应的人体黑白二值图构成的数据集,并训练一个由前者生成后者的生成对抗网络模型。该模型将二维点云图转化为相应的黑白二值图。将该二值图输入一个训练好的卷积神经网络,用于评估二维图像到三维人体模型构建的效果。考虑到由不完整三维点云数据重建完整的三维人体网格模型是一个具有挑战性的问题,因此通过模拟二维点云的破损和残缺状态,使得算法能够处理不完整的二维点云图。大量的实验结果表明,该方法重建出的三维人体模型能够有效实现视觉上的真实感,为了对重建后的精度进行定量的分析,选取了人体特征中具有代表性的腰围特征作为误差评估;为了增加三维人体模型库中人体形态的多样性,还引入一种便捷的三维人体模型数据增强技术。实验结果表明,该算法只需要输入一张二维点云图像,就能快速创建出相应的数字化人体模型。  相似文献   

11.
针对3维人脸重建问题提出了一种新颖的多视图体重建方法,以解决目前3维人脸重建方法只适用于小样本集合,大范围推广时精度难以保证的弱点。该方法创新之处在于将基于特征点匹配的重建方法与立体重建方法结合引入到图割优化框架,并应用于3维人脸重建。本文两个重要改进工作是设计动态片结构描述来进行颜色一致性估计以及设计新的动态图结构以去除半个体素尺寸的重建误差。实验中分别采用8张、16张和30张存在亮度变化的人脸多视角图像验证算法。实验结果逼真,同时避免了传统重建方法结果受限于样本集分布的问题。  相似文献   

12.
基于生成对抗网络的多视图学习与重构算法   总被引:2,自引:0,他引:2  
同一事物通常需要从不同角度进行表达.然而,现实应用经常引出复杂的场景,导致完整视图数据很难获得.因此研究如何构建事物的完整视图具有重要意义.本文提出一种基于生成对抗网络(Generative adversarial networks,GAN)的多视图学习与重构算法,利用已知单一视图,通过生成式方法构建其他视图.为构建多视图通用的表征,提出新型表征学习算法,使得同一实例的任意视图都能映射至相同的表征向量,并保证其包含实例的重构信息.为构建给定事物的多种视图,提出基于生成对抗网络的重构算法,在生成模型中加入表征信息,保证了生成视图数据与源视图相匹配.所提出的算法的优势在于避免了不同视图间的直接映射,解决了训练数据视图不完整问题,以及构造视图与已知视图正确对应问题.在手写体数字数据集MNIST,街景数字数据集SVHN和人脸数据集CelebA上的模拟实验结果表明,所提出的算法具有很好的重构性能.  相似文献   

13.
在自动驾驶领域,计算机对周围环境的感知和理解是必不可少的.其中,相比于二维目标检测,三维点云目标检测可以提供二维目标检测所不具有的物体的三维方位信息,这对于安全自动驾驶是至关重要的.针对三维目标检测中原始输入点云到检测结果之间跨度大的问题,首先,提出了基于结构感知的候选区域生成模块,其中定义了每个点的结构特征,充分利用...  相似文献   

14.
This paper concentrates on the problem of image reconstruction from compressed sensing (CS) measurements in multi-view compressed imaging systems, where each view is acquired independently by CS technique. In order to take advantage of both the inter-view correlation and the spatial prior information in multi-view image sets, a weighted total variation (TV) regularized model, which combines the TV norm of a target view and the TV norm of the corresponding residual, is proposed. To efficiently solve the weighted TV regularization constrained problem, novel algorithms are presented for both the anisotropy TV and the isotropy TV cases. Given the multi-view CS measurements, a sliding window-based recovery framework is also developed to work with the weighted TV-based reconstruction algorithms and produce high-quality results. We show by experiments that the proposed methods greatly outperform the straight forward reconstruction which applies view by view image reconstruction independently, and also have significant advantages over other benchmark methods.  相似文献   

15.
The paper studies a 3D fingerprint reconstruction technique based on multi-view touchless fingerprint images. This technique offers a solution for 3D fingerprint image generation and application when only multi-view 2D images are available. However, the difficulties and stresses of 3D fingerprint reconstruction are the establishment of feature correspondences based on 2D touchless fingerprint images and the estimation of the finger shape model. In this paper, several popular used features, such as scale invariant feature transformation (SIFT) feature, ridge feature and minutiae, are employed for correspondences establishment. To extract these fingerprint features accurately, an improved fingerprint enhancement method has been proposed by polishing orientation and ridge frequency maps according to the characteristics of 2D touchless fingerprint images. Therefore, correspondences can be established by adopting hierarchical fingerprint matching approaches. Through an analysis of 440 3D point cloud finger data (220 fingers, 2 pictures each) collected by a 3D scanning technique, i.e., the structured light illumination (SLI) method, the finger shape model is estimated. It is found that the binary quadratic function is more suitable for the finger shape model than the other mixed model tested in this paper. In our experiments, the reconstruction accuracy is illustrated by constructing a cylinder. Furthermore, results obtained from different fingerprint feature correspondences are analyzed and compared to show which features are more suitable for 3D fingerprint images generation.  相似文献   

16.
三维人脸相较于二维人脸包含了更多特征信息,可应用于如人脸识别、影视娱乐、医疗美容等更多实际应用场景,因此三维人脸重建技术一直是计算机视觉领域的研究热点.由于真实三维人脸数据较难获取,很多基于深度学习的重建算法首先利用传统重建方法为大量二维人脸图像构建三维标签,作为训练数据,这些数据可能并不精准,从而导致算法的重建精度受到影响.为此,本文提出一种基于multi-level损失函数的弱监督学习模型,结合传统三维人脸形变模型3DMM与深度学习方法,直接从大量无三维标签的二维人脸图像中学习三维人脸特征信息,从而实现基于单张二维人脸图像的三维人脸重建算法.此外,为解决二维人脸图像中常存在遮挡或大姿态情况而影响人脸纹理重建的问题,本文使用基于CelebAMask-HQ数据集的人脸解析分割算法对图像进行预处理去除遮挡区域.实验结果表明,基于本文方法的三维人脸重建质量与重建精度均实现了一定的提升.  相似文献   

17.
We describe how the pipeline for 3D online reconstruction using commodity depth and image scanning hardware can be made scalable for large spatial extents and high scanning resolutions. Our modified pipeline requires less than 10% of the memory that is required by previous approaches at similar speed and resolution. To achieve this, we avoid storing a 3D distance field and weight map during online scene reconstruction. Instead, surface samples are binned into a high‐resolution binary voxel grid. This grid is used in combination with caching and deferred processing of depth images to reconstruct the scene geometry. For pose estimation, GPU ray‐casting is performed on the binary voxel grid. A one‐to‐one comparison to level‐set ray‐casting in a distance volume indicates slightly lower pose accuracy. To enable unlimited spatial extents and store acquired samples at the appropriate level of detail, we combine a hash map with a hierarchical tree representation.  相似文献   

18.
3D reconstruction based on single view aims to reconstruct the entire 3D shape of an object from one perspective. When existing methods reconstruct the mesh surface of complex objects, the surface details are difficult to predict and the reconstruction visual effect is poor because the mesh representation is not easily integrated into the deep learning framework; the 3D topology is easily limited by predefined templates and inflexible, and unnecessary mesh self-intersections and connections will be generated when reconstructing complex topology, thus destroying the surface details; the training of the reconstruction network is limited by the large amount of information attached to the mesh vertices, and the training time of the reconstructed network is too long. In this paper, we propose a method for fast mesh reconstruction from single view based on Graph Convolutional Network (GCN) and topology modification. We use GCN to ensure the generation of high-quality mesh surfaces and use topology modification to improve the flexibility of the topology. Meanwhile, a feature fusion method is proposed to make full use of the features of each stage of the image hierarchically. We use 3D open dataset ShapeNet to train our network and add a new weight parameter to speed up the training process. Extensive experiments demonstrate that our method can not only reconstruct object meshes on complex topological surfaces, but also has better qualitative and quantitative results.  相似文献   

19.
目的 由于室内点云场景中物体的密集性、复杂性以及多遮挡等带来的数据不完整和多噪声问题,极大地限制了室内点云场景的重建工作,无法保证场景重建的准确度。为了更好地从无序点云中恢复出完整的场景,提出了一种基于语义分割的室内场景重建方法。方法 通过体素滤波对原始数据进行下采样,计算场景三维尺度不变特征变换(3D scale-invariant feature transform,3D SIFT)特征点,融合下采样结果与场景特征点从而获得优化的场景下采样结果;利用随机抽样一致算法(random sample consensus,RANSAC)对融合采样后的场景提取平面特征,将该特征输入PointNet网络中进行训练,确保共面的点具有相同的局部特征,从而得到每个点在数据集中各个类别的置信度,在此基础上,提出了一种基于投影的区域生长优化方法,聚合语义分割结果中同一物体的点,获得更精细的分割结果;将场景物体的分割结果划分为内环境元素或外环境元素,分别采用模型匹配的方法、平面拟合的方法从而实现场景的重建。结果 在S3DIS (Stanford large-scale 3D indoor space dataset)数据集上进行实验,本文融合采样算法对后续方法的效率和效果有着不同程度的提高,采样后平面提取算法的运行时间仅为采样前的15%;而语义分割方法在全局准确率(overall accuracy,OA)和平均交并比(mean intersection over union,mIoU)两个方面比PointNet网络分别提高了2.3%和4.2%。结论 本文方法能够在保留关键点的同时提高计算效率,在分割准确率方面也有着明显提升,同时可以得到高质量的重建结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号