首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 84 毫秒
1.
为快速生成准确描述图片内容的语句,提出语义分割和卷积神经网络(convolutional neural network, CNN)相结合的图像描述方法。将图像分类模型和语义分割模型结合为编码器,增强对图像语义信息的利用,采用CNN代替长短时记忆网络(long short term memory, LSTM)作为解码器生成完整描述性语句。通过在MSCOCO数据集上与5种主流算法的对比实验可知,以CNN作为解码器能够大幅提高解码速度,语义信息的增强能够有效提高实验精度,验证了该方法的有效性和可行性。  相似文献   

2.
烟尘图像分割是图像分割方法的一个较新的应用方向。高效、准确的烟尘图像分割技术对于大气污染监控、森林火灾预警以及军事情报获取等方面都有重要的意义。将阈值分割、区域生长、区域分裂与合并等基于区域的方法用于烟尘图像分割,并对三种分割方法在烟尘图像分割中的性能表现进行了分析。研究结果对烟尘图像分割中算法的选型具有一定的参考价值。  相似文献   

3.
针对工业烟尘在图像分割过程中容易受到背景中运动干扰物、复杂场景环境的影响,提出了一种基于背景建模与特征匹配的工业烟尘图像分割方法.通过建立背景模型并对背景进行实时更新,构造出准确的背景图像;通过差分累积出烟尘动态区域,采用形态学填充的方法,得到粗分割烟尘区域,通过特征匹配的方法,去除干扰,得到相对完整的烟尘分割区域;对实际钢铁行业的烟尘排放视频进行验证实验,并与其他分割方法进行了对比,结果表明:所提方法能够较好地区分出背景干扰物和烟尘,能够相对完整地分割烟尘区域,具有一定的适用性和抗干扰能力和较好的实用性.  相似文献   

4.
5.
工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注意力机制将两个U-Net网络组合成W-Net, W-Net能充分利用烟尘的轮廓、位置信息进行烟尘粗分割和细分割操作,两次分割能达到更精细的分割效果;此外,针对W-Net中的普通卷积功能过于简单而不能更好地提取烟尘特征的问题,提出一种兼具残差块和ASPP功能的残差ASPP结构,同时还能根据大小目标烟尘的特点进行针对性分割,分割结果更全面完整.实验结果表明,结合衔接注意力机制与残差ASPP的W-Net以较小的分割效率损失为代价获得了较高的分割精度, Recall, IoU与F-score指标提高了4%~5%,解决了大小目标烟尘存在的分割问题,烟尘的分割效果也优于其他语义分割网络.  相似文献   

6.
工业烟尘污染等级监测中烟尘的准确分割是污染等级判定的重要前提.针对边缘模糊且方向多变烟尘在特征提取过程中边缘方向细节信息提取困难、分割不准确的问题,本文提出一种频域多方向C-UNet及动态损失的工业烟尘图像分割方法.首先,通过构建轮廓波多方向分解下采样结构增强编码阶段烟尘边缘方向信息的提取能力;其次,通过轮廓波变换提取烟尘8个边缘方向细节信息进行跳跃连接,提升持续采样过程中细节信息的表达准确度;然后,构建轮廓波细节重构上采样结构增强解码阶段烟尘边缘细节信息的恢复能力;最后,提出一种动态加权策略构建组合损失函数来优化训练网络,增强网络对烟尘边缘特征的提取能力.结果表明,本文方法与U-Net和其他同类方法相比在指标上有较好提升,改善了烟尘边缘分割不准确的问题,在不同烟尘场景上的分割效果也优于现有分割模型.  相似文献   

7.
传统抽取算法在病灶、细节区域存在分割不精准的问题.改进算法对U-net深度神经网络进行改进,在网络底层加入Dense-net网络中的稠密连接方式,使用BConvLSTM来组合编码器和解码器的特征信息,结合AC-net思想提出Mul-tiAc模块,在U-net下采样和上采样过程加入该模块,帮助网络学习更复杂的特征信息,在预测过程中提高精确率.通过在DRIVE、STARE、CHASE_DB1这3个公开眼底数据库的实验,分割结果的客观评价指标与主观视觉验证了改进算法在分割精度方面的有效性.  相似文献   

8.
结合注意力机制的编解码框架模型已经被广泛地应用在图像描述任务中。大多数方法都强制对生成的每个单词进行主动的视觉注意,然而,解码器很可能不需要关注图像中的任何视觉信息就生成非视觉单词,比如“the”和“of”。本文提出一种自适应注意力模型,编码端采用Faster R-CNN网络提取图像中的显著特征,解码端LSTM网络中引入一个视觉监督信号。在每个时间步长,它可以自动地决定何时依赖于视觉信号,何时仅依赖于语言模型。最后在Flickr30K和MS-COCO数据集进行验证,实验结果表明该模型有效地提升了描述语句的质量。  相似文献   

9.
自动生成图片描述是自然语言处理和计算机视觉的热点研究话题,要求计算机理解图像语义信息并用人类自然语言的形式进行文字表述.针对当前生成中文图像描述整体质量不高的问题,提出首先利用FastText生成词向量,利用卷积神经网络提取图像全局特征;然后将成对的语句和图像〈S, I〉进行编码,并融合为两者的多模态特征矩阵;最后模型采用多层的长短时记忆网络对多模态特征矩阵进行解码,并通过计算余弦相似度得到解码的结果.通过对比发现所提模型在双语评估研究(BLEU)指标上优于其他模型,生成的中文描述可以准确概括图像的语义信息.  相似文献   

10.
基于全卷积网络的图像语义分割方法综述   总被引:1,自引:0,他引:1  
自全卷积网络(Fully Convolutional Network,FCN)提出以后,应用深度学习技术在图像语义分割领域受到了许多计算机视觉和机器学习研究者的关注,现在这一方向已经成为人工智能方向的研究热点.FCN的核心思想是搭建一个全卷积网络,输入任意尺寸的图像,经过模型的有效学习和推理得到相同尺寸的输出.FCN的提出给图像语义分割领域提供了新的思路,但也存在很多的缺点,比如特征分辨率低、对象存在多尺度问题等.随着研究者不断的钻研,卷积神经网络在图像分割领域逐渐得到了优化和拓展,基于FCN的主流分割框架也层出不穷.图像语义分割对于场景理解的重要性日渐突出,被广泛应用到无人驾驶技术、无人机领域和医疗影像检测与分析等任务中.因此,对图像语义分割领域的研究将值得深入研究,使其能够更好在实际应用中大放异彩.  相似文献   

11.
为提高虫情图像的分割和计数的准确率,提出了一种基于卷积神经网络的虫情图像分割和计数方法。该方法基于U-Net模型构造了一种昆虫图像分割的模型Insect-Net,将完整的虫情图像和切割后的虫情图像分别输入模型后,提取两者特征进行融合。将融合后的特征输入1个1×1的卷积层得到最终分割结果,再将得到的结果二值化后,采用轮廓检测算法将昆虫目标与背景分离并计数。实验结果表明,该方法在虫情图像中取得了较高的分割正确率和计数正确率,分别为94.4%和89.2%。用深度学习和卷积神经网络的方法有效提高了虫情图像的计数精度,并且为昆虫识别分类提供了大量的无背景数据集。  相似文献   

12.
针对森林这样的大空间、复杂场景下的火灾检测,提出一种在单帧视频序列图像中的烟检测方法,并研究一种新的超像素合并算法,改进现有的天地线检测算法。该方法对图像进行SLIC(Simple Linear Iterative Clustering)超像素分割,并用一种新的超像素合并算法解决过分割问题;通过改进的天地线分割算法,排除天空中云对于烟检测的干扰;根据光谱特征,运用支持向量机(SVM)对超像素块进行分类。实验结果表明,超像素合并算法高效简洁,易于编程实现,基于图像分割的烟检测技术能排除云雾等噪声对烟雾检测的干扰,在森林场景下的烟雾检测正确率为77%,可以作为人工森林火灾监测的辅助手段。  相似文献   

13.
14.
针对现有的基于深度学习的神经网络模型通常都是对单一的语料库进行训练学习,提出了一种大规模的多语料库联合学习的中文分词方法。语料库分别为简体中文数据集(PKU、MSRA、CTB6)和繁体中文数据集(CITYU、AS),每一个数据集输入语句的句首和句尾分别添加一对标志符。应用BLSTM(双向长短时记忆模型)和CRF(条件随机场模型)对数据集进行单独训练和多语料库共同训练的实验,结果表明大规模的多语料库共同学习训练能取得良好的分词效果。  相似文献   

15.
针对腹部CT影像邻近器官对比度较低及因个体肝脏形状差异较大等引起肝脏分割困难的问题,提出了全卷积神经网络肝脏分割模型。首先通过卷积神经网络提取图像深层、抽象的特征,再通过反卷积运算对提取到的特征映射进行插值重构后得到分割结果。由于单纯进行反卷积得到的分割结果往往比较粗糙,因此,在反卷积之前,先融合高层与低层的特征,并且通过增加反卷积的层数、减少反卷积步长,得到了更为精确的分割结果。与传统卷积神经网络的分割方法相比,该模型可以充分利用CT影像的空间信息。实验数据表明该模型能够使腹部CT影像肝脏分割具有较高的精度。  相似文献   

16.
基于边缘检测与分裂合并的图像分割算法   总被引:2,自引:0,他引:2  
针对传统分裂合并算法容易产生方块效应与过分割的缺点,提出了一种结合边缘检测和分裂合并的图像分割算法.该算法直接利用图像的边缘信息进行分裂,不断将图像分裂为一些不规则形状的一致性区域,然后根据一定规则将相似的区域合并.实验表明,该算法能大幅减少分裂次数,并有效克服方块效应和过分割等缺点,图像分割效果较好.  相似文献   

17.
奶牛行为识别过程中,奶牛目标精准检测是重要前提。一般的奶牛目标检测采用纹理和颜色信息进行识别,对于长时间静止和复杂背景干扰的目标存在目标丢失和检测不精准问题。针对上述问题,文章将图像分割方法和区域面积剔除方法相结合,实现复杂环境下的静止奶牛目标检测。实验结果表明,该方法达到97.4%的识别率。  相似文献   

18.
烟雾图像分割是对烟雾进行识别与精准定位的基础, 是火灾预警的重要手段. 针对烟雾分割时存在过分割、欠分割以及边界拟合粗糙的问题, 本文提出一种基于频率分离特性的烟雾图像分割网络. 所提出的频率分离模块将特征图中的烟雾区域分离为低频主体部分和高频边界部分, 同时基于多任务学习设计多模块权重自适应损失函数对烟雾整体、主体、边界分别监督学习, 起到细化烟雾边界和改善烟雾整体分割结果的作用; 此外, 结合可变形卷积提出改进的空洞空间金字塔池化模块以解决其信息利用率低和特征关联性差的问题. 在对比实验中, FSNet的烟雾交并比为76.55%, 比基线网络提高了4.25%. 可视化分割结果可以看出, FSNet能有效缓解过分割、欠分割, 所得烟雾边界更平滑, 烟雾图像分割的整体性能获得较大提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号