首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种文档图像多尺度分割算法   总被引:1,自引:0,他引:1  
1.研究背景随着数字图书馆和电子办公应用的日益普及,面对大量纸质原始文件及资料的数字化,直接扫描、存储和传输文档的需求越来越多,为了解决扫描文档图像庞大信息量和存储容量、传输带宽之间的矛盾,迫切需要专门针对文档图像研究新的高性能压缩算法。根据扫描文挡页面的内容特征,提高压缩比最有挖掘潜力的方法是对文档图像进行图文分割后再分别  相似文献   

2.
针对现有的图像语义分割算法存在小尺度目标丢失和分割不连续的问题,提出多尺度融合增强的图像语义分割算法,该算法在DeeplabV3+网络模型的基础上,通过构建多尺度特征提取和融合增强网络提高了对小目标特征的描述能力,使网络在分割大目标的同时也能获得小目标的特征信息,从而解决了语义分割时小尺度目标丢失和分割不连续的问题。在Cityscapes数据集上实验的结果表明,改进后的算法明显提升了小目标分割精度,解决了分割不连续的问题。最后在公开数据集PASCAL VOC 2012上进一步验证了改进算法的泛化性。  相似文献   

3.
为解决Deeplab v3+网络在解码过程中仅融合一个尺度编码特征,导致部分细节信息丢失,从而造成最终分割结果较为粗糙等问题,提出多尺度特征自适应融合的图像语义分割算法.该算法在Deeplab v3+的解码过程中使用自适应空间特征融合结构,给不同尺度的编码特征分配自适应的融合权重,通过融合编码过程中的多尺度特征进行特征...  相似文献   

4.
吉伯斯随机场(Gibbs Random Fields,GRF)作为一种引入图像空间信息的先验模型已广泛运用于贝叶斯图像分割中.然而迄今为止,所涉及的这类先验模型往往仅体现为单一尺度上的马尔科夫性,而在多尺度意义上却未曾涉及.首次通过扩展传统单尺度意义上GRF模型到多尺度上,即多尺度吉伯斯随机场,从而圆满地解决这些难题.实验表明:所提出的模型算法有很好的鲁棒性,且易于实现对图像无监督的精确分割.  相似文献   

5.
针对当前图像语义分割Deeplab v3+模型浅层特征分辨率低、遗漏分割等问题,引入全卷积神经网络(FCNN),并在此基础上联合超像素分割实现对物体边缘特殊优势、粗糙分割结果的优化,采用空洞卷积设计多尺度特征融合模块,以提升图像空间信息利用率。为提高网络学习能力与网络性能,引入跳跃连接结构和两个损失函数,经过训练测试,证实该算法具有良好的像素精度,可提升分割准确率提高,鲁棒性强,可改善遗漏分割与错误分割。  相似文献   

6.
深度学习的发展加快了图像语义分割的研究.目前,最有效的图像语义分割研究方法大部分都是基于全卷积神经网络(FCNN),尽管现有的语义分割方法能有效地对图像进行整体分割,但对于图像中的重叠遮挡物体不能清晰地识别出边缘信息,也不能有效地融合图像高低层的特征信息.针对以上问题,在采用FCNN来解决图像语义分割问题的基础上,利用...  相似文献   

7.
针对现有的图像语义分割算法存在的因细节信息丢失导致分割效果不佳的问题,论文提出一种基于DeepLabV3+的改进算法。论文的深度学习网络分为编码器和解码器模块,在编码器模块使用改进的ResNet_101和空洞空间金字塔池化结构提取多尺度特征,在解码器模块结合多个输出,并且融合图像低层信息,解决目标细节丢失问题。为验证论文算法的有效性,在PASCAL VOC 2012数据集上进行实验,结果表明,改进后的算法在物体细节处理方面得到了良好效果,性能方面有所提升。  相似文献   

8.
一种形态学彩色图像多尺度分割算法   总被引:5,自引:0,他引:5       下载免费PDF全文
为了对彩色图像进行快速有效的分割,提出了一种用于分割彩色图像的多尺度形态学算法。该算法首先用基于张量梯度的彩色分水岭算法来得到初始分割结果,即局部水平集连通区域,并综合考虑了面积和色彩计算区域间的相似性,构造了区域间的RAG(region adjacency graph)和NNG(nearest neighbor nraph),用于后续形态学处理;接着,基于HSV空间中的色彩全序关系,定义了彩色形态算子;然后采用顶点塌缩算法实现的彩色形态学开闭算子生成了所需的非线性尺度空间;最后,利用图像中的极值点与物体间的对应关系,逐级提取图像中包含的物体来得到分层级的表示,并用区域在不同尺度下熵的变化来决定尺度树的构成,从而完成了彩色图像的分割。试验结果表明,该算法不仅具有出色的形状保持能力,而且可提高计算效率。  相似文献   

9.
利用小波变换模大值边缘检测算法得到SAR图像不同尺度下的边缘信息,再利用MRF分割算法对SAR图像进行分割。实验结果表明,该方法改善了SAR图像分割的质量,有效地改善了MRF图像分割算法的方向灵敏性。  相似文献   

10.
针对现有的语义分割算法存在分割结果空间不一致的问题,提出一种基于加权损失函数的多尺度对抗网络语义分割算法。在DeepLab v3基本框架的基础上,引入Pix2pix网络作为生成对抗网络模型,实现多尺度对抗网络语义分割。同时,为增加模型的泛化能力与训练精度,提出将传统的多分类交叉熵损失函数与生成器输出的内容损失函数和鉴别器输出的对抗损失函数相结合,构建加权损失函数。大量定性定量实验结果表明,该算法能够识别并分割细小的物体,其语义分割性能超过现有的深度网络,在保证语义分割空间一致性的同时提高了分割效率。  相似文献   

11.
尹波  李楠  方涛 《微型电脑应用》2007,23(12):23-25,34
该文提出一种基于区域合并的遥感图像多尺度分割方法,此方法综合利用遥感图像的光谱特征和形状特征信息来描述区域对象的特性,并在此基础上给出两个相邻区域的合并代价,通过不同阈值对合并代价进行限制,以得到不同尺度大小的分割结果。为提高遥感图像分割的效率,使用分块策略对初始区域邻接图进行划分。实验证明,这种改进的多尺度分割方法遥感图像分割精度较好,同时效率有了较大的提高。  相似文献   

12.
遥感图像分割是目前学术界和工业界的一个研究热点,在城市规划、变化检测以及GIS信息构建等方面有着十分广泛的应用.然而,诸多复杂因素(如多变的尺度、多样化的拓扑形状以及复杂的背景和阴影等)使得遥感图像语义分割成为一项具有挑战性的任务.为此,提出一种基于多尺度信息融合的遥感图像语义分割深层卷积神经网络模型,该模型分为编码器和解码器2部分.在编码阶段,设计了基于DenseNet网络的跨卷积层级的多尺度特征融合策略,采用子区域全局平均池化及多尺度卷积处理复杂的背景区域;在解码阶段,为了准确地恢复图像的细节信息,设计了能够融合不同层级卷积特征的短解码器;最后,在整体模型构建方面设计了一种具有多输出的分层监督机制网络模型,从不同层级获取监督信息,可在充分利用监督信息的同时更好地引导网络的训练.在ISPRS公开数据集以及北京市遥感数据集上,通过实验验证了文中模型的有效性.  相似文献   

13.
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题, 本文提出了一种语义分割网络(LDPANet). 首先, 将空洞卷积与引入残差学习单元的深度可分离卷积结合, 来优化编码器结构, 在降低了计算复杂度的同时缓解梯度消失的问题. 然后利用层传递的迭代空洞空间金字塔, 将自顶向下的特征信息依次融合, 提高了上下文信息的有效交互能力; 在多尺度特征融合之后引入属性注意力模块, 使网络抑制冗余信息, 强化重要特征. 再者, 以通道扩展上采样代替双线插值上采样作为解码器, 进一步提升了特征图的分辨率. 最后, LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%, 与近几年网络模型相比, 本文网络模型可以精确地提取像素的位置信息以及空间维度信息, 提高了语义分割的准确率.  相似文献   

14.
针对高分辨率SAR图像的分割问题,提出一种基于多尺度继承性的分割算法。该算法综合利用图像的宏观和微观特征,将传统的单尺度信息处理技术纳入尺度不断变化的动态分析框架中,更容易获得图像的本质特征。同时,使用异性扩散方程获得多尺度图像序列,采用一种由粗尺度到细尺度的分割策略,先进行粗尺度分割,然后以此分割结果来引导较细尺度层的分割。分割过程中采用迭代自组织的数据分析算法自适应地确定每一层分割的区域个数,较好地建立尺度之间的分割继承关系。该分割算法可以满足不同图像处理任务的需求,也更加符合人的认知过程和视觉处理系  相似文献   

15.
目的 针对反恐、安防领域利用监控视频进行步态识别时由光照、拍摄角度、遮挡等多协变量引起的轮廓缺失、人体阴影和运算时间等问题,提出了一种基于RPGNet(Regin of Interest+Parts of Body Semantics+GaitNet)网络的步态人体语义分割方法。方法 该方法按照功能划分为R(region of interest)模块、P(parts of body semantics)模块和GNet(GaitNet)模块。R模块提取人体步态感兴趣区域,起到提升算法效率和图像去噪的作用。P模块借助LabelMe开源图像注释工具进行步态人体部位语义标注。GNet模块进行步态人体部位语义训练与分割。借鉴ResNet和RefineNet网络模型,设计了一种细节性步态语义分割网络模型。结果 对步态数据库1 380张图片进行了测试,RPGNet方法与6种人体轮廓分割方法进行了对比实验,实验结果表明RPGNet方法对细节和全局信息处理得都很精确,在0°、45°和90°视角都表现出较高的分割正确率。在多人、戴帽和遮挡条件下,实验结果表明RPGNet方法人体分割效果良好,能够满足步态识别过程中的实时性要求。结论 实验结果表明,RPGNet步态人体语义分割方法在多协变量情况下能够有效进行步态人体语义分割,同时也有效提高了步态识别的识别率。  相似文献   

16.
17.
郭小卫  官小平 《遥感信息》2006,(6):20-22,54
提出了一种多尺度无监督遥感图像分割方法。通过对多尺度图像数据在每个尺度上进行Gauss子集聚类,并将每个像素的邻域内的Gauss子集类别标记作为特征向量,利用Markov四叉树模型进行二次聚类,从而实现无监督图像分割。与其他基于多尺度Markov模型的无监督分割方法和传统动态聚类方法相比,该方法既无需假定每类的分布形式,又能较好地反映数据的概率结构。合成图像与SAR图像的实验结果表明,该方法的分割精度接近于有监督的H-MPM和H-SMAP方法。  相似文献   

18.
在图像的采集过程中,图像往往会带有一定的噪声信息,这些噪声信息会破坏图像的纹理结构,进而干扰语义分割任务.现有基于带噪图像的语义分割方法,大都是采取先去噪再分割的模型.然而,这种方式会导致在去噪任务中丢失语义信息,从而影响分割任务.为了解决该问题,提出了一种多尺度多阶段特征融合的带噪图像语义分割的方法,利用主干网络中各阶段的高级语义信息以及低级图像信息来强化目标轮廓语义信息.通过构建阶段性协同的分割去噪块,迭代协同分割和去噪任务,进而捕获更准确的语义特征.在PASCAL VOC 2012和Cityscapes数据集上进行了定量评估,实验结果表明,在不同方差的噪声干扰下,模型依旧取得了较好的分割结果.  相似文献   

19.
高分辨率遥感图像语义分割在国土规划、地理监测、智慧城市等领域有着广泛的应用价值,但是现阶段研究中存在相似地物和精细地物分割不准确问题。为解决这一问题,提出了一种新型的多尺度语义分割网络MSSNet。它由编码层、解码层和输出层组成。为解决相似地物的分割问题,编码层使用深层网络ResNet101充分提取地物特征,并在解码层的解码器中加入残差块,提高基于像素点的分类能力。为解决精细结构地物的分割问题,解码层中的解码器加入了空洞空间金字塔池化结构提取多尺度地物特征,以便精确分割不同尺度的地物。为了强化语义分割能力,输出层合并了多个解码器的输出,为最终的预测提供了更多的信息。在两个公开数据集Vaihingen和Potsdam上进行了实验,分别取得了87%和87.3%的全局精确度,超过了大多数已发表的方法。实验结果表明,提出的MSSNet能够精确地分割相似地物和精细地物,并且具有训练过程简单和易于使用的优点,非常适合进行高分辨率遥感图像语义分割。  相似文献   

20.
目的 针对自然场景下图像语义分割易受物体自身形状多样性、距离和光照等因素影响的问题,本文提出一种新的基于条形池化与通道注意力机制的双分支语义分割网络(strip pooling and channel attention net, SPCANet)。方法 SPCANet从空间与内容两方面对图像特征进行抽取。首先,空间感知子网引入1维膨胀卷积与多尺度思想对条形池化技术进行优化改进,进一步在编码阶段增大水平与竖直方向上的感受野;其次,为了提升模型的内容感知能力,将在ImageNet数据集上预训练好的VGG16(Visual Geometry Group 16-layer network)作为内容感知子网,以辅助空间感知子网优化语义分割的嵌入特征,改善空间感知子网造成的图像细节信息缺失问题。此外,使用二阶通道注意力进一步优化网络中间层与高层的特征选择,并在一定程度上缓解光照产生的色差对分割结果的影响。结果 使用Cityscapes作为实验数据,将本文方法与其他基于深度神经网络的分割方法进行对比,并从可视化效果和评测指标两方面进行分析。SPCANet在目标分割指标mIoU(mean inter...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号