首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
张冲  黄影平  郭志阳  杨静怡 《光电工程》2022,49(5):210378-1-210378-12

车道线识别是自动驾驶环境感知的一项重要任务。近年来,基于卷积神经网络的深度学习方法在目标检测和场景分割中取得了很好的效果。本文借鉴语义分割的思想,设计了一个基于编码解码结构的轻量级车道线分割网络。针对卷积神经网络计算量大的问题,引入深度可分离卷积来替代普通卷积以减少卷积运算量。此外,提出了一种更高效的卷积结构LaneConv和LaneDeconv来进一步提高计算效率。为了获取更好的车道线特征表示能力,在编码阶段本文引入了一种将空间注意力和通道注意力串联的双注意力机制模块(CBAM)来提高车道线分割精度。在Tusimple车道线数据集上进行了大量实验,结果表明,本文方法能够显著提升车道线的分割速度,且在各种条件下都具有良好的分割效果和鲁棒性。与现有的车道线分割模型相比,本文方法在分割精度方面相似甚至更优,而在速度方面则有明显提升。

  相似文献   

2.
郑斌军  孔玲君 《包装工程》2022,43(1):187-194
目的为了实现良好的图像语义分割精度,同时尽可能降低网络的参数量,加快网络训练速度,提出基于DeepLabv3+的图像语义分割优化方法。方法编码器主干网络增加注意力机制模块,并采用更密集的特征池化模块有效聚合多尺度特征,同时使用深度可分离卷积降低网络计算复杂度。结果基于CamVid数据集的对比实验显示,优化后网络的MIoU分数达到了71.03%,在像素精度、平均像素精度等其他方面的评价指标上较原网络有小幅提升,并且网络参数量降低了12%。在Cityscapes的测试数据集上的MIoU分数为75.1%。结论实验结果表明,优化后的网络能够有效提取图像特征信息,提高语义分割精度,同时降低模型复杂度。文中网络使用城市道路场景数据集进行测试,可以为今后的无人驾驶技术的应用提供参考,具有一定的实际意义。  相似文献   

3.
《中国测试》2019,(11):126-130
通信机房机柜的智能维护是实现设备无人化、智能化监管的核心工作之一,结合语义分割技术实现设备图像识别、位置检测、检修操作点确定,形成泛用性强的人工智能方法。该文从深度学习语义分割方法入手,提出基于Mask R-CNN的机房机柜设备图像语义分割技术方案,实现不同视野、存在物体遮挡条件下的机房机柜图像识别与分割。通过模拟不同语义分割算法在通信机房机柜检测场景的应用效果,表明基于Mask R-CNN的语义分割技术准确性良好,Top-1错误率为7.1%、像素级分割准确性mIOU达82.3%。  相似文献   

4.
张莹  黄影平  郭志阳  张冲 《光电工程》2021,48(12):210340-1-210340-12
道路检测是车辆实现自动驾驶的前提。近年来,基于深度学习的多源数据融合成为当前自动驾驶研究的一个热点。本文采用卷积神经网络对激光雷达点云和图像数据加以融合,实现对交通场景中道路的分割。本文提出了像素级、特征级和决策级多种融合方案,尤其是在特征级融合中设计了四种交叉融合方案,对各种方案进行对比研究,给出最佳融合方案。在网络构架上,采用编码解码结构的语义分割卷积神经网络作为基础网络,将点云法线特征与RGB图像特征在不同的层级进行交叉融合。融合后的数据进入解码器还原,最后使用激活函数得到检测结果。实验使用KITTI数据集进行评估,验证了各种融合方案的性能,实验结果表明,本文提出的融合方案E具有最好的分割性能。与其他道路检测方法的比较实验表明,本文方法可以获得较好的整体性能。  相似文献   

5.
目的针对卷积神经网络在RGB-D(彩色-深度)图像中进行语义分割任务时模型参数量大且分割精度不高的问题,提出一种融合高效通道注意力机制的轻量级语义分割网络。方法文中网络基于RefineNet,利用深度可分离卷积(Depthwiseseparableconvolution)来轻量化网络模型,并在编码网络和解码网络中分别融合高效的通道注意力机制。首先RGB-D图像通过带有通道注意力机制的编码器网络,分别对RGB图像和深度图像进行特征提取;然后经过融合模块将2种特征进行多维度融合;最后融合特征经过轻量化的解码器网络得到分割结果,并与RefineNet等6种网络的分割结果进行对比分析。结果对提出的算法在语义分割网络常用公开数据集上进行了实验,实验结果显示文中网络模型参数为90.41 MB,且平均交并比(mIoU)比RefineNet网络提高了1.7%,达到了45.3%。结论实验结果表明,文中网络在参数量大幅减少的情况下还能提高了语义分割精度。  相似文献   

6.
在场景识别任务中,由于场景图像类内变化大,类间相似度高,不同场景类别之间表现出相似的外观和对象分布,从而容易导致场景识别任务的失败.为解决该问题,本文提出一种基于语义分割及高效网络相结合的场景识别模型.该模型由语义分支和RGB分支两部分组成,语义分支在语义分割基础上进一步提取图像上下文信息,RGB分支采用高效网络来提取图像的全局特征,通过注意力机制将两个分支的输出特征进行融合,最终输入线性分类器以实现场景识别的预测.将提出的网络模型在ADE20K,MIT Indoor 67和SUN3973个数据集进行训练与测试,实验结果表明,提出的模型可以显著减少网络参数数量,同时提高场景识别的准确率.  相似文献   

7.
张立国  程瑶  金梅  王娜 《计量学报》2021,42(4):515-520
室内场景的语义分割一直是深度学习语义分割领域的一个重要方向.室内语义分割主要存在的问题有语义类别多、很多物体类会有相互遮挡、某些类之间相似性较高等.针对这些问题,提出了一种用于室内场景语义分割的方法.该方法在BiSeNet(bilateral segmentation network)的网络结构基础上,引入了一个空洞金...  相似文献   

8.
方面级细粒度情感分类是指针对文本数据,分析其在指定方面的情感极性.由于获取到的评论样本往往涉及不同的方面,导致各个方面的情感极性不平衡.为了减少不平衡数据对模型训练的影响,本文提出了一种新的数据平衡方法——批处理平衡方法(BB),用来平衡多标签多类别数据.同时,由于评论文本蕴含多个方面,传统模型结构往往每次只能预测一个...  相似文献   

9.
孙红  袁巫凯  赵迎志 《包装工程》2023,44(1):141-150
目的 为了进一步提升语义分割精度,解决当前语义分割算法中特征图分辨率低下,低级信息特征随意丢弃,以及上下文重要信息不能顾及等问题,文中尝试提出一种融合反馈注意力模块的并行式多分辨率语义分割算法。方法 该算法提出一种并行式网络结构,在其中融合了高低分辨率信息,尽可能多地保留高维信息,减少低级信息要素的丢失,提升分割图像的分辨率。同时还在主干网络中嵌入了带反馈机制的感知注意力模块,从通道、空间、全局3个角度获得每个样本的权重信息,着重加强样本之间的特征重要性。在训练过程中,还使用了改进的损失函数,降低训练和优化难度。结果 经实验表明,文中的算法模型在PASCAL VOC2012、Camvid上的MIOU指标分别为77.78%、58.67%,在ADE20K上的也有42.52%,体现了出较好的分割性能。结论 文中的算法模型效果相较于之前的分割网络有一定程度的提升,算法中的部分模块嵌入别的主干网络依旧表现出较好的性能,展现了文中算法模型具备一定的有效性和泛化能力。  相似文献   

10.
孙红  杨晨  莫光萍  朱江明 《包装工程》2023,44(11):299-308
目的 为了提升彩色图像的分割精度,解决彩色图像分割中存在庞大计算成本和冗余参数的问题,本文提出一种双分支特征提取网络来解决上述问题。方法 双分支特征提取网络主要由语义信息分支和空间细节分支组成。语义信息分支通过在非对称残差模块中设置不同的空洞卷积率来获取输入图像不同尺度的上下文信息。空间细节分支是一个浅层且简单的网络,用于建立每个像素间的局部依赖关系以保留细节。在双分支之后连接一个特征聚合模块来有效地结合这2个分支的输出。结果 在没有任何预训练和后处理的情况下,在单块RTX2080Ti GPU上仅用0.91 M参数在Cityscapes数据集上以97帧/s的速度实现75.1%的分割准确性,在Camvid数据集上以107帧/s的推理速度取得了70.5%的分割效果。结论 通过大量实验证明,本文模型在分割准确性和效率之间取得了较好的平衡。  相似文献   

11.
针对滚动轴承在不同工况环境中故障诊断训练时间长、准确率低和泛化性能弱的问题,提出了基于注意力机制改进残差神经网络的轴承故障诊断方法。为了提高ResNet模型的准确率和泛化性,提出了基于注意力机制的SE-ResNet模型和CBAM-ResNet模型,并在凯斯西储大学数据集上进行了试验,在同工况有训练集的情况下ResNet模型测试的准确率为97.28%,在不同工况下模型直接迁移的准确率为94.14%~96.86%,CBAM-ResNet模型在不同工况下模型直接迁移的准确率为97.14%~98.86%,SE-ResNet模型在不同工况下模型直接迁移的准确率为97.86%~99.71%,两种改进模型的准确率都明显优于原ResNet模型,表明提出的优化模型提高了ResNet模型的准确率和泛化性。  相似文献   

12.
本文提出了一种基于下采样的特征融合遥感图像语义分割模型,该模型在编解码结构基础上,将高分辨率原始图像引入"下采样"模块提取低级语义特征,在此基础上,将输出的低级语义特征通过MobileNetV2和空间金字塔池化进一步提取多尺度高级语义细节特征,然后,将这些高级语义特征和直接从下采样模块提取的低级语义特征融合并进行特征图分割.最后,在"CCF卫星影像的AI分类与识别竞赛"的数据集上取得了93%的训练准确率以及91%的预测准确率.  相似文献   

13.
道路交通环境具有复杂、强干扰、多遮挡、检测物体尺度变化大、光线不均匀、难以预测的特点,传统基于全卷积神经网络的分割方法,由于采用单一的检测结果评价标准,缺乏对分割结果一致性的检验,忽略了像素与像素的相互关系,造成误识别很可能导致交通事故发生。本文在传统交并比评价指标的基础之上,采用交通环境语义分割复合评价指标,提出基于条件生成对抗网络的交通环境多任务语义分割方法,采用对抗损失拟合语义分割结果像素之间的作用关系,使得结果更具备一致性和可用性,更利于实际应用,同时对比了三种典型交通环境检测任务,验证了算法的有效性,并对三种任务进行多任务学习,在不增加计算开销的基础上,获得相近的性能。  相似文献   

14.
丁俊华  袁明辉 《光电工程》2023,50(12):230242-1-230242-11

在毫米波合成孔径雷达(SAR)安检成像违禁品的检测与识别中,存在着目标尺寸过小、目标被部分遮挡和多目标之间重叠等复杂情况,不利于违禁品的准确识别。针对这些问题,提出了一种基于双分支多尺度融合网络(DBMFnet)的违禁品检测方法。该网络使用Encoder-Decoder的结构,在Encoder阶段,提出一种双分支并行特征提取网络(DBPFEN)来增强特征提取;在Decoder阶段,提出一种多尺度融合模块(MSFM)来提高对目标的检测能力。实验结果表明,该方法的均交并比(mIoU)均优于现有的语义分割方法,降低了漏检与错检率。

  相似文献   

15.
薛丽霞  江迪  汪荣贵  杨娟 《光电工程》2019,46(9):180468-1-180468-9
卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特征;其次,利用注意力机制将数据集中的每个标签类别和输出特征图中的每个通道进行对应;最后,利用监督学习的方式学习通道之间的关联性,也就是学习标签之间的关联性。实验结果表明,本文方法可以有效地学习标签之间语义关联性,并提升多标签图像分类效果。  相似文献   

16.
目的 交通标志识别作为智能驾驶、交通系统研究中的一项重要内容,具有较大的理论价值和应用前景.尤其是文本型交通标志,其含有丰富的高层语义信息,能够提供极其丰富的道路信息.因此通过设计并实现一套新的端到端交通标志文本识别系统,达到有效缓解交通拥堵、提高道路安全的目的.方法 系统主要包括文本区域检测和文字识别两个视觉任务,并基于卷积神经网络的深度学习技术实现.首先以ResNet-50为骨干网络提取特征,并采用类FPN结构进行多层特征融合,将融合后的特征作为文本检测和识别的共享特征.文本检测定位文本区域并输出候选文本框的坐标,文字识别输出词条对应的文本字符串.结果 通过实验验证,系统在Traffic Guide Panel Dataset上取得了令人满意的结果,行识别准确率为71.08%.结论 端到端交通标志文本识别非常具有现实意义.通过卷积神经网络的深度学习技术,提出了一套端到端交通标志文本识别系统,并在开源的Traffic Guide Panel Dataset上证明了该系统的优越性.  相似文献   

17.
建筑信息模型(BIM)为工程建设提供了丰富的空间和属性信息,三维激光扫描等三维信息获取技术的发展使获取工程建设三维场景信息变得更加便捷、高效。通过融合实际工程点云与BIM,将有助于实现工程建设质量和进度管理的自动化。既有研究一般比对点云与BIM的全局信息,需要工程人员根据不同规则检查判断,结果难以定量呈现。同时,比对结果无法与BIM构件属性自动关联并服务于智能化分析。针对上述问题,该文引入深度学习点云语义分割技术,对框架梁柱节点实现构件的对象化比对,提高了点云与BIM比对的自动化和数字化程度。模拟试验研究表明,采用的PointNet++模型在框架节点点云语义分割任务中取得了较高的精度,并对数据误差具有较好的健壮性,可为对象化的施工偏差比对提供良好的数据基础。该文方法实现的框架节点施工点云与BIM模型的对象化偏差比对,将在施工偏差展示、测量数据数字化和施工进度管理方面具有良好的应用价值和发展潜力。  相似文献   

18.
徐胜军  杨华  李明海  刘光辉  孟月波  韩九强 《光电工程》2023,50(12):230225-1-230225-17

针对低照度图像质量较差、噪声多、纹理模糊等问题,提出一种基于双频域特征聚合的低照度增强网络(dual frequency-domain feature aggregation network, DF-DFANet)。首先,构建频谱光照估计模块(frequency domain illumination estimation module, FDIEM)实现跨域特征提取,通过共轭对称约束调整频域特征图抑制噪声信号,并采用逐层融合方式提高多尺度融合效率以扩大特征图感受野范围。其次,设计多谱双注意力模块(multiple spectral attention module, MSAM)聚焦图像局部频率特征,通过小波域空间、通道注意力机制关注图像细节信息。最后,提出双域特征聚合模块(dual domain feature aggregation module, DDFAM)融合傅里叶域和小波域特征信息,利用激活函数计算自适应调整权重实现像素级图像增强,并结合傅里叶域全局信息提高融合效果。实验结果表明,在LOL数据集上所提网络的PSNR达到24.3714,SSIM达到0.8937。与对比网络相比,所提网络增强效果更具自然性。

  相似文献   

19.
孙刘杰  刘磊 《包装工程》2024,45(3):193-200
目的 将深度学习应用于数字水印,在隐藏信息的同时,不断提高图像的不可见性和鲁棒性,提出一种结合空间域和频率域的多尺度扩张卷积注意力数字水印算法(SF-ACA)。方法 SF-ACA算法的网络框架包含由ACA和SFE构成的生成器、解码器2个部分组成。其中,ACA网络中的MCA模块将3个不同扩张率的扩张卷积对载体图像以多尺度融合的方式进行特征提取,使载体图像能更有效地隐藏水印信息;SFE结合快速傅里叶卷积块,在空域和频域中通过不同大小的感受野捕获互补信息,更精准地获取水印的特征信息,增强了秘密信息的不可见性和鲁棒性。结果 本文提出的水印方法在隐藏与载体图像尺寸相等的三通道彩色图像时,PSNR值为38.81 dB,较UDH方法的PSNR值提高了7.78%。水印图像的隐藏容量是4 096比特,该算法与UDH方法在Dropout、Gaussian噪声、JPEG攻击下,提取精度分别提升了5.38%、10.5%、1.65%,满足不可见性要求的同时实现了强鲁棒性。结论 本文方法在隐藏容量较大时,不可见性和鲁棒性都达到了较好的性能。  相似文献   

20.
徐鹏  徐方勇  陈辉 《计量学报》2022,43(3):325-330
针对室外场景范围广、分割难度大、识别效果不显著等问题,提出了一种融合多站点云配准的室外大场景分割方法.首先,根据室外场景视野大、点云数据量庞大特点,选取多个视角下重叠区域较多的建筑场景点集,结合SAC-IA和ICP方法进行点云自动配准,从而构建出点云密度相对均匀的室外大场景完整结构;然后,选用公共数据集Semantic...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号