期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马淼刘培敏潘海鹏《中国图象图形学报》2023,28(8):2432-2446

目的机器人在进行同时定位与地图构建（simultaneous localization and mapping,SLAM）时需要有效利用未知复杂环境的场景信息,针对现有SLAM算法对场景细节理解不够及建图细节信息缺失的问题,本文构造出一种将SLAM点云定位技术与语义分割网络相结合的未知环境地图构建方法,实现高精度三维地图重建。方法首先,利用场景的实时彩色信息进行相机的位姿估计,并构造融合空间多尺度稀疏及稠密特征的深度学习网络HieSemNet（hierarchical semantic network）,对未知场景信息进行语义分割,得到场景的实时二维语义信息;其次,利用深度信息和相机位姿进行空间点云估计,并将二维语义分割信息与三维点云信息融合,使语义分割的结果对应到点云的相应空间位置,构建出具有语义信息的高精度点云地图,实现三维地图重建。结果为验证本文方法的有效性,分别针对所构造的HieSemNet网络和语义SLAM系统进行验证实验。实验结果表明,本文的网络在平均像素准确度和平均交并比上均取得了较好的精度,MPA（mean pixel accuracy）指标相较于其他网络分别提高了17.47%、11.67%、4.86%、2.90%和0.44%,MIoU（mean intersection over union）指标分别提高了13.94%、1.10%、6.28%、2.28%和0.62%。本文的SLAM算法可以获得更多的建图信息,构建的地图精度和准确度都更好。结论本文方法充分考虑了不同尺寸物体的分割效果,提出的HieSemNet网络能有效提高场景语义分割准确性,此外,与现有的前沿语义SLAM系统相比,本文方法能够明显提高建图的精度和准确度,获得更高质量的地图。相似文献

2.

动态场景下基于语义分割的视觉SLAM方法

杜晓英袁庆霓齐建友王晨杜飞龙任澳《计算机工程》2024,(3):242-249

针对在动态场景下视觉同步定位与建图（SLAM）鲁棒性差、定位与建图精度易受动态物体干扰的问题,设计一种基于改进DeepLabv3plus与多视图几何的语义视觉SLAM算法。以语义分割网络DeepLabv3plus为基础,采用轻量级卷积网络MobileNetV2进行特征提取,并使用深度可分离卷积代替空洞空间金字塔池化模块中的标准卷积,同时引入注意力机制,提出改进的语义分割网络DeepLabv3plus。将改进后的语义分割网络DeepLabv3plus与多视图几何结合,提出动态点检测方法,以提高视觉SLAM在动态场景下的鲁棒性。在此基础上,构建包含语义信息和几何信息的三维语义静态地图。在TUM数据集上的实验结果表明,与ORB-SLAM2相比,该算法在高动态序列下的绝对轨迹误差的均方根误差值和标准差（SD）值最高分别提升98%和97%。相似文献

3.

视觉SLAM在室内动态场景中的应用研究

下载免费PDF全文

徐少杰曹雏清王永娟《计算机工程与应用》2021,57(8):175-179

视觉SLAM（Simultaneous Localization And Mapping,同时定位与建图）是移动机器人领域的核心技术,传统视觉SLAM还难以适用于高动态场景并且地图中缺少语义信息。提出一种动态环境语义SLAM方法,用深度学习网络对图像进行目标检测,检测动态目标所在区域,对图像进行特征提取并剔除动态物体所在区域的特征点,利用静态的特征点进行位姿计算,对关键帧进行语义分割,在构建语义地图时滤除动态物体的地图点构建出无动态物体干扰的语义地图。在TUM数据集上进行实验,结果显示该方法在动态环境下可以提升88.3%位姿估计精度,并且可同时构建出无动态物体干扰的语义地图。相似文献

4.

基于局部特征聚合网络的三维语义分割

刘经纬 周彦《计算技术与自动化》2024,(2):170-176

激光雷达采集的自动驾驶场景点云数据规模庞大且包含丰富的空间结构信息,一些方法将点云变换到体素化网格等稠密表示形式进行处理,但却忽略了点云变换引起的信息丢失问题,导致分割性能降低。为此,提出了一种基于局部特征聚合网络的三维语义分割方法。其中的局部特征融合模块,聚合中心点的K个最近点的特征,并通过强大的注意力机制,得到增强的点特征,从而弥补丢失的信息,提高网络的分割精度。此外,为了提高小物体的分类精度,提出了3D注意力特征融合块,通过摒弃常规的特征图拼接,使用注意力机制来决定不同层次语义特征的权重,得到更加丰富的语义特征,提高网络的性能。在SemanticKITTI和nuScenes数据集上的大量实验表明了该方法的优越性。相似文献

5.

动态环境下基于延迟语义的RGB-D SLAM算法

王浩周申超方宝富《模式识别与人工智能》2023,(10):953-966

目前,将分割网络与SLAM(Simultaneous Localization and Mapping)结合已成为解决视觉SLAM不能应用于动态环境的主流方案之一,但是SLAM系统受到分割网络处理速度的限制,无法保证实时运行.为此,文中提出基于延迟语义的RGB-D SLAM算法.首先,并行运行跟踪线程与分割线程,为了得到最新的延迟语义信息,采取跨帧分割的策略处理图像,跟踪线程根据延迟语义信息实时生成当前帧的语义信息.然后,结合成功跟踪计数(STC)与极线约束,筛选当前帧动态点的集合,并确定环境中先验动态物体的真实运动状态.若确定该物体在移动,继续将物体区域细分为矩形网格,以网格为最小单位剔除动态特征点.最后,利用静态特征点追踪相机位姿并构建环境地图.在TUM RGB-D动态场景数据集及真实场景上的实验表明文中算法在大部分数据集上表现较优,由此验证算法的有效性. 相似文献

6.

一种基于RGB-D相机的语义地图构建方法

郭旭达宋勇磊《计算机与数字工程》2023,(10):2438-2443

在三维地图中添加环境语义信息,可以有助于移动机器人更快更精确地进行初始及移动状态时的定位定向。论文提出一种基于RGB-D相机的三维语义地图构建方法,首先,使用语义分割深度学习模型提取RGB图像中的语义信息,通过相邻的多帧图像数据关联去除误识别数据。然后与深度图像进行数据关联生成带有语义标签的点云数据,最后通过增量融合的方法构建周围环境的三维语义地图。基于ScanNet(v2)数据集的对比实验,论文方法可以有效地提高数据关联准确率,为基于3D地图导航提供具有丰富语义信息的导引地图。相似文献

7.

室内动态场景下的语义SLAM

唐鼎新袁亮冉腾《计算机工程与设计》2020,41(12):3538-3543

针对ORB-SLAM2算法在动态场景下定位精度有限导致基于该算法的三维建图出现重叠和错误等问题,结合Farneback光流法剔除动态目标的特征点,优化相机位姿,使用语义分割模型PSPNet提取的语义信息剔除场景中的动态目标,得到静态的三维语义地图。在公开的TUM数据集上的实验结果表明,Farneback光流法有效提高了室内动态环境下移动机器人的定位精度,绝对轨迹的均方根误差平均可达到50.74%的提升,平移和旋转漂移的误差也明显改善。对公开数据集和真实场景构建三维语义地图,与其它SLAM算法进行建图对比,能更准确构建动态场景下静态的三维语义地图。相似文献

8.

基于深度卷积神经网络的语义地图构建

胡美玉张云洲秦操刘桐伯《机器人》2019,(4)

本文将图像语义分割与即时定位与地图构建(SLAM)技术相结合构建环境的3维语义地图.输入的图像序列经过ORB-SLAM进行关键帧筛选.提出了一种基于DeepLab算法改进的图像语义分割方法.在卷积网络的最后一层后面引入上采样卷积层,改善双线性插值过于粗糙的问题.关键帧的深度图作为门控信号控制不同卷积操作的选择,从而在对远处的物体保持细节的同时对近处的物体保持较大视野.然后,对齐分割后的图像与深度图,利用相邻关键帧之间的空间对应关系构建3维稠密语义地图.实验结果表明,对于室内和室外场景,本文算法可以实现准确的语义分割,反投影到3维空间中也能形成效果良好的语义地图;与当前大多数基于DeepLab与反卷积算法的方法相比,本文算法可以得到更好的语义地图. 相似文献

9.

基于局部语义拓扑图的视觉SLAM闭环检测 总被引：1，自引：0，他引：1

张括嘉张云洲吕光浩龚益群《机器人》2019,41(5):649-659

针对视觉SLAM(同步定位与地图创建)中现有的闭环检测方法容易产生假阳性检测的问题,利用YOLOv3目标检测算法获取场景中的语义信息,以DBSCAN(density-based spatial clustering of application with noise)算法修正错误检测和遗漏检测,构建语义节点,对关键帧形成局部语义拓扑图.利用图像特征和目标类别信息进行语义节点匹配,计算不同语义拓扑图中对应边的变换关系,得到关键帧之间的相似度,并根据连续关键帧的相似度变化情况进行闭环的判断.在公开数据集上的实验表明,目标聚类有效地提高了室内场景下的闭环检测准确性.与单纯利用传统视觉特征的算法相比,本文算法能够获得更加准确的闭环检测结果. 相似文献

10.

基于SLAM算法和深度神经网络的语义地图构建研究

《计算机应用与软件》2018,(1)

语义地图在移动机器人的导航等任务中有着关键的作用。目前基于视觉的机器人自动定位和制图(SLAM)系统已经能够达到较高的定位精度要求,但是基于多目几何的视觉SLAM算法并未充分利用空间中丰富的语义信息,地图中保留的地图点信息只是没有语义的空间几何点。由于基于卷积神经网络的算法在目标检测领域取得了突破性的成绩,利用目前最新的基于卷积神经网络的目标检测算法YOLO,实现场景的实时目标检测,并结合SLAM算法构建语义地图。将视觉SLAM定位的精确性和深度神经网络在语义提取方面的优势相结合,既能够提高SLAM算法的准确性,同时采集到的丰富图像信息又能进一步训练更加深的神经网络。该算法能够应用于机器人的智能导航,同时也能作为数据采集器为其他视觉任务提供具备语义与几何信息的图像数据。相似文献

11.

基于多级特征图联合上采样的实时语义分割

宋宇王小瑀梁超程超《计算机技术与发展》2022,(2):82-87

视觉感知是无人驾驶技术中的重要一环,而语义分割技术又是实现视觉感知的主要技术手段之一.现在的语义分割技术多采用计算量大、内存占用高的空洞卷积来提取高分辨率特征图,从而导致现在主流的语义分割网络分割速度不足,无法有效应用于无人驾驶的场景中.针对这一问题,提出了一种实时性更好的语义分割网络.首先,采用了一种轻量级的卷积神经... 相似文献

12.

融合稀疏注意力和实例增强的雷达点云分割

下载免费PDF全文

刘盛曹益烽黄文豪李丁达《中国图象图形学报》2023,28(2):483-494

目的雷达点云语义分割是3维环境感知的重要环节,准确分割雷达点云对象对无人驾驶汽车和自主移动机器人等应用具有重要意义。由于雷达点云数据具有非结构化特征,为提取有效的语义信息,通常将不规则的点云数据投影成结构化的2维图像,但会造成点云数据中几何信息丢失,不能得到高精度分割效果。此外,真实数据集中存在数据分布不均匀问题,导致小样本物体分割效果较差。为解决这些问题,本文提出一种基于稀疏注意力和实例增强的雷达点云分割方法,有效提高了激光雷达点云语义分割精度。方法针对数据集中数据分布不平衡问题,采用实例注入方式增强点云数据。首先,通过提取数据集中的点云实例数据,并在训练中将实例数据注入到每一帧点云中,实现实例增强的效果。由于稀疏卷积网络不能获得较大的感受野,提出Transformer模块扩大网络的感受野。为了提取特征图的关键信息,使用基于稀疏卷积的空间注意力机制,显著提高了网络性能。另外,对不同类别点云对象的边缘,提出新的TVloss用于增强网络的监督能力。结果本文提出的模型在SemanticKITTI和nuScenes数据集上进行测试。在SemanticKITTI数据集上,本文方法在线单帧... 相似文献

13.

基于多分支网络的道路场景实时语义分割方法

廖文森徐成刘宏哲李学伟《计算机应用研究》2023,40(8)

针对目前实时语义分割方法存在大目标分割不准确、小目标信息丢失的问题,提出一种基于多分支网络的实时语义分割算法。首先,对双边分割网络进行优化,设计了金字塔分支扩大感受野,以覆盖视野内的大目标,充分地将上下文信息结合起来;其次,设计双边指导融合模块,为深层和浅层的特征映射提供指导信息,弥补小目标信息的损失。最后在Cityscapes数据集上进行验证,实验结果表明所提模型以51.3 fps的推理速度使平均交并比达到77.8%,与基准相比,精度提高了2.5个百分点。所提方法采用金字塔分支,在扩大感受野的同时,获取不同尺度的语义边缘区域特性,增强对语义边界的建模能力,且提出的双边指导融合模块可以更有效地融合不同层次的特征,弥补下采样造成的信息丢失,能够更好地指导模型学习。相似文献

14.

空洞可分离卷积和注意力机制的实时语义分割

下载免费PDF全文

王囡侯志强蒲磊马素刚程环环《中国图象图形学报》2022,27(4):1216-1225

目的为满足语义分割算法准确度和实时性的要求,提出了一种基于空洞可分离卷积模块和注意力机制的实时语义分割方法。方法将深度可分离卷积与不同空洞率的空洞卷积相结合,设计了一个空洞可分离卷积模块,在减少模型计算量的同时,能够更高效地提取特征;在网络输出端加入了通道注意力模块和空间注意力模块,增强对特征的通道信息和空间信息的表达并与原始特征融合,以进一步提高特征的表达能力;将融合的特征上采样到原图大小,预测像素类别,实现语义分割。结果在Cityscapes数据集和CamVid数据集上进行了实验验证,分别取得70.4%和67.8%的分割精度,速度达到71帧/s,而模型参数量仅为0.66 M。在不影响速度的情况下,分割精度比原始方法分别提高了1.2%和1.2%,验证了该方法的有效性。同时,与近年来的实时语义分割方法相比也表现出一定优势。结论本文方法采用空洞可分离卷积模块和注意力模块,在减少模型计算量的同时,能够更高效地提取特征,且在保证实时分割的情况下提升分割精度,在准确度和实时性之间达到了有效的平衡。相似文献

15.

LRUNet:轻量级脑肿瘤快速语义分割网络

下载免费PDF全文

何康辉肖志勇《中国图象图形学报》2021,26(9):2233-2242

目的针对目前基于深度学习的脑肿瘤分割算法参数量大、计算复杂和快速性差的问题,提出了一种超轻量级快速语义分割网络LRUNet （lightweight rapid UNet）,在保证分割精度提升的同时,极大地减少了网络的参数量与计算量,达到快速分割的效果。方法 LRUNet网络结构基于UNet,将3D-UNet的通道数减少为原来的1/4,减少原先3D-UNet过多的参数量;将UNet网络中除最后一层外的所有传统卷积变为深度可分离卷积,深度可分离卷积以牺牲极少精度,大大减少网络参数量,实现网络的轻量级;使用空间—通道压缩和激发模块（spatial and channel squeeze&excitation block,scSE）,该模块能够放大特征图中对模型有利的参数的权重,缩小对模型不利参数的权重,提升网络分割的精度。结果在BraTS 2018（Brain Tumor Segmentation Challenge 2018）数据集上的在线验证结果显示,该模型在全肿瘤、核心区肿瘤和增强区肿瘤分割的平均Dice系数分别为0.893 6、0.804 6和0.787 2。LRUNet与同为轻量级网络的S3D-UNet相比Dice有所提升,但是,参数量仅为S3D-UNet的1/4,FLOPs （floating point operations per second）仅为1/2。结论与3D-UNet、S3D-UNet和3D-ESPNet等算法相比,LRUNet算法不仅保证精度得到提升,而且极大地减少网络中计算的参数量与计算成本消耗,同时网络模型的预测速度得到很大提升,使得快速语义分割在3维医学图像领域成为可能。相似文献

16.

结合全局注意力机制的实时语义分割网络

下载免费PDF全文

李涛高志刚管晟媛徐久成马媛媛《智能系统学报》2023,18(2):282-292

针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network ,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。相似文献

17.

动态环境下基于增强分割的RGB-D SLAM方法

王浩卢德玖方宝富《机器人》2022,44(4):418-430

目前视觉SLAM（同步定位与地图创建）方法在动态环境下易出现漏剔除动态物体的问题,影响相机位姿估计精度以及地图的可用性。为此,本文提出一种基于增强分割的RGB-D SLAM方法。首先结合实例分割网络与深度图像聚类的结果,判断当前帧是否出现漏分割现象,若出现则根据多帧信息对分割结果进行修补,同时,提取当前帧的Shi-To... 相似文献

18.

激光—相机系统语义栅格建图和路径规划

下载免费PDF全文

丁梦远郭迟黄凯《中国图象图形学报》2021,26(10):2524-2532

目的 SLAM（simultaneous localization and mapping）是移动机器人在未知环境进行探索、感知和导航的关键技术。激光SLAM测量精确，便于机器人导航和路径规划，但缺乏语义信息。而视觉SLAM的图像能提供丰富的语义信息，特征区分度更高，但其构建的地图不能直接用于路径规划和导航。为了实现移动机器人构建语义地图并在地图上进行路径规划，本文提出一种语义栅格建图方法。方法建立可同步获取激光和语义数据的激光-相机系统，将采集的激光分割数据与目标检测算法获得的物体包围盒进行匹配，得到各物体对应的语义激光分割数据。将连续多帧语义激光分割数据同步融入占据栅格地图。对具有不同语义类别的栅格进行聚类，得到标注物体类别和轮廓的语义栅格地图。此外，针对语义栅格地图发布导航任务，利用路径搜索算法进行路径规划，并对其进行改进。结果在实验室走廊和办公室分别进行了语义栅格建图的实验，并与原始栅格地图进行了比较。在语义栅格地图的基础上进行了路径规划，并采用了语义赋权算法对易移动物体的路径进行对比。结论多种环境下的实验表明本文方法能获得与真实环境一致性较高、标注环境中物体类别和轮廓的语义栅格地图，且实验硬件结构简单、成本低、性能良好，适用于智能化机器人的导航和路径规划。相似文献

19.

改进DeepLabV3+的高效语义分割

马冬梅李鹏辉黄欣悦张倩杨鑫《计算机工程与科学》2022,44(4):737-745

针对目前高精度的语义分割模型普遍存在计算复杂度高、占用内存大,难以在硬件存储和计算力有限的嵌入式平台部署的问题,从网络的参数量、计算量和性能3个方面综合考虑,提出一种基于改进DeepLabV3+的高效语义分割模型.该模型以MobileNetV2为骨干网络,在空洞空间金字塔池化(AS-PP)模块中并联混合带状池化(MSP... 相似文献

20.

噪声指导下过滤光照风格实现低光照场景的语义分割

罗俊宣士斌刘家林《计算机应用研究》2024,41(1)

低光照图像分割一直是图像分割的难点,低光照引起的低对比度和高模糊性使得这类图像分割比一般图像分割困难很多。为了提高低光照环境下语义分割的准确度,根据低光照图像自身特征,提出一种噪声指导下过滤光照风格的低光照场景语义分割模型（SFIS）。该模型综合利用信噪比作为先验知识,通过指导长距离分支中的自注意力操作、长/短距离分支的特征融合,对图像中不同噪声的区域采用不同距离的交互。还进一步设计了一个光照过滤器,该模块从图像的整体风格中进一步提取光照风格信息。通过交替训练光照过滤器与语义分割模型,逐步减小不同光照条件之间的光照风格差距,从而使分割网络学习到光照不变特征。提出的模型在数据集LLRGBD上优于之前的工作,取得了较好的结果。在真实数据集LLRGBD-real上的mIoU达到66.8%,说明所提出的长短距离分支模块和光照过滤器模块能够有效提升模型在低光照环境下的语义分割能力。相似文献