首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
图像的自动标注是图像检索领域一项基础而又富有挑战性的任务。深度学习算法自提出以来在图像和文本识别领域取得了巨大的成功,是一种解决"语义鸿沟"问题的有效方法。图像标注问题可以分解为基于图像与标签相关关系的基本图像标注和基于标注词汇共生关系的标注改善两个过程。文中将基本图像标注问题视为一个多标记学习问题,图像的标签先验知识作为深度神经网络的监督信息。在得到基本标注词汇的基础上,利用原始图像标签词汇的依赖关系与先验分布改善了图像的标注结果。最后将所提出的改进的深度学习模型应用于Corel和ESP图像数据集,验证了该模型框架及所提出的解决方案的有效性。  相似文献   

2.
戴珊  李广军 《计算机科学》2016,43(Z6):191-193
提出一种统一的图像自动分割模型。为了将图像分为颜色、纹理相近的不同的区域,提出了一个处理方法,具体分为两个步骤:首先,用改进的简单线性迭代聚类算法对输入图像进行预处理,即过分割;然后,用其低阶颜色矩表示这些区域的特征,并进一步利用近邻传播聚类算法将这些区域进行合并。在公开的数据集上进行了详细的实验,结果证明了所提算法的有效性和健壮性。  相似文献   

3.
In this paper, we introduce a generalized asymmetric fronts propagation model based on the geodesic distance maps and the Eikonal partial differential equations. One of the key ingredients for the computation of the geodesic distance map is the geodesic metric, which can govern the action of the geodesic distance level set propagation. We consider a Finsler metric with the Randers form, through which the asymmetry and anisotropy enhancements can be taken into account to prevent the fronts leaking problem during the fronts propagation. These enhancements can be derived from the image edge-dependent vector field such as the gradient vector flow. The numerical implementations are carried out by the Finsler variant of the fast marching method, leading to very efficient interactive segmentation schemes. We apply the proposed Finsler fronts propagation model to image segmentation applications. Specifically, the foreground and background segmentation is implemented by the Voronoi index map. In addition, for the application of tubularity segmentation, we exploit the level set lines of the geodesic distance map associated with the proposed Finsler metric providing that a thresholding value is given.  相似文献   

4.
针对前景和背景深度交叠或相机运动时基于深度统计的传统视频分割算法中存在的问题,提出一种基于时空测地线的方法,并证明该方法适合基于深度的视频分割.首先使用基于运动检测的方式进行初始化;然后使用基于特征点选择方式定义种子结点,特征点匹配方式构建时域链接,空间上8邻域像素连接形成空域链接,在连续两帧之间构建时空测地线传播图;最后在时空测地线传播图上使用泛化测地线距离变换将前一帧的分割结果传播到当前帧,并自适应地在传播和检测间切换消除累计误差.实验结果表明,该方法能够在复杂场景和相机运动情形下输出稳定的分割结果.  相似文献   

5.
6.
人像分割技术在人脸识别、3D人体重建及运动捕捉等实际应用中具有重要的作用,其可靠性直接影响后续处理的效果。本文以标签传递理论的目标分割算法为基础,提出了一种优化的人像分割算法。首先,引入模糊集理论,提高复杂背景图像分割的能力;然后,使用超像素过分割进行预处理,利用过分割结果优化相似度定义提高分割轮廓的平滑性和可靠性。实验结果表明,与原有标签传递算法相比,本文提出的算法可以保持较高的分割轮廓平滑度且具有更高的分割精度。  相似文献   

7.
现有的交互式分割算法对用户标记的数量与位置较为敏感,为此,提出一种基于两级协同扩散的分割算法。将均值漂移分割的小块区域作为虚拟像素,参与构建两级加权图,为信息向远方同质区域传播提供路径。采用状态迭代过程实现信息传播,收敛后得到所有像素对各种标志的隶属度,并进行隶属度比较,完成分割。实验结果表明,与单级传播算法相比,该算法即使采用少量用户标记也可以获得满意的分割结果,对标记的数量与位置具有较高的鲁棒性。  相似文献   

8.
基于多代表点近邻传播聚类算法,提出一种有效的大数据图像的快速分割算法。 该算法首先运用均值漂移算法将彩色图像分割成很多小的同质区域,然后计算每个区域中所有 像素的颜色向量平均值,并用区域数目代替原图像像素点数目,选用区域间的距离作为相似度 的测度指标,最后应用多代表点近邻传播聚类算法在区域相似度矩阵上进行二次聚类,得到最 终的图像分割结果。实验结果证明,提出的算法在大数据图像的分割中取得了较为满意的分割 效果,且分割效率较高。  相似文献   

9.
Programming and Computer Software - This paper describes a new method for medical data segmentation based on superpixel propagation. The proposed method is a modification of the classical region...  相似文献   

10.
基于扩展生成语言模型的图像自动标注方法   总被引:3,自引:0,他引:3  
使用最大权匹配算法,结合统计平滑技术,提出图像区域特征生成概率估计方法,并进一步对训练集中标注词之间的语义相关性(correlation)进行分析与度量,给出一种基于生成模型的图像标注算法.算法使用所提出的基于最大权匹配的图像生成概率估计方法得到较好的起始点,进而设计启发式迭代函数对词与词的相关性加以利用,最终提高标注词与图像的语义相关性.在现实世界图像数据库上的实验结果验证了所提出标注方法的有效性.  相似文献   

11.
基于多尺度信念传播的混凝土CT图像分割?   总被引:1,自引:0,他引:1       下载免费PDF全文
为减少混凝土CT图像分割过程中信念信息传递的计算复杂度,提出一种基于多尺度信念传播的图像快速分割算法。根据标准信念传播算法的特点,构造金字塔状栅格图进行消息传输,从而加快消息收敛速度、减少迭代次数,同时利用双向图技术减少信念信息的数量。实验结果表明,该算法能提高图像分割率和分割精度。  相似文献   

12.
改进近邻传播聚类的彩色图像分割   总被引:2,自引:0,他引:2  
针对近邻传播(AP)聚类算法存在运算时间长、空间复杂度高而难以应用于较大规模图像数据处理的问题,提出一种将mean shift(MS)算法和AP算法相结合的彩色图像分割方法——MSAP算法.首先应用MS算法对输入目标图像进行预分割,将分割后的区域数目代替原图像像素点数目作为AP算法输入数据的规模,计算每个区域中所有像素的彩色向量平均值,并将其作为AP算法输入的数据点,选用数据点间的距离作为相似度的测度指标;然后应用AP算法在数据相似度矩阵上进行聚类,得到最终的图像分割结果.实验结果表明,与AP算法相比,MSAP算法在运行时间和分割效果方面都有显著的提高.  相似文献   

13.
王梅  周向东  许红涛  施伯乐 《软件学报》2009,20(9):2450-2461
图像语义的自动标注是一个具有挑战性的研究课题,目前常见的机器学习方法,如统计生成模型(generative model)与判别模型(discriminative model)都被用于该问题的研究中.然而由于语义鸿沟的存在、图像训练数据的不平衡性以及图像标注的多标签特性等问题,使得上述方法的性能都有待进一步提高.提出一种基于可判别超平面树的生成模型图像标注方法.该方法根据待标注目标图像的高生成概率邻域,建立局部超平面分类树,进而利用同层类间可判别信息,按自顶向下的层次分类得到待标注图像的语义相关图像集合.由此得到的相关类信息与新的生成模型框架相结合对待标注图像与语义关键词的联合概率进行估计,实现对目标图像的标注.其特点在于生成模型与判别模型方法得到了有效结合,可判别超平面树对隐含语义聚类的判别分析是对待标注图像的生成"邻域"的逐步求精过程,有效地提高了生成模型标注准确度;而对于判别分析难以解决的多标签分类、训练数据不平衡等问题,此方法通过联合概率估计自然地实现目标图像的多标签分配.在常用的包含5 000幅图像的ECCV2002数据集进行了实验,结果表明,与目前已知的具有较好标注效果的基于生成模型的MBRM模型(采用图像分割方法)以及基于辨别分析的ASVM-MIL相比,此方法的F1因子分别提高了14%和13%.  相似文献   

14.
虽然图像语义分割因其有助于更好地分析和理解图像而被广泛应用于多个领域,但是基于全卷积神经网络的模型在语义分割方面依然存在分辨率重构及如何利用上下文信息的问题.因此,文中提出基于语义传播与前/背景感知的图像语义分割网络.首先,提出联合语义传播上采样模块,提取高层特征的全局语义信息与局部语义信息,用于得到语义权重,将高层特...  相似文献   

15.
目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配模块和短时匹配模块分别与第一帧和前一帧做相关操作进行像素级匹配,得到的全局相似性图和局部相似性图,以及前一帧的掩模和当前帧的特征图,经过两个优化网络后通过分割网络得到分割结果。在视频目标分割公开数据集上的实验表明,所提出方法在单目标和多目标上分别取得了86.5%和77.4%的区域相似度和轮廓精度均值,每秒可计算21帧。提出的短时匹配模块比仅使用掩模更有利于提取前一帧的信息,通过长时匹配模块和短时匹配模块的结合,不使用在线微调即可实现高效的视频目标分割,适合应用于移动机器人视觉感知。  相似文献   

16.
传统基于像素的立体匹配算法误匹配率较高.为解决该问题,提出一种基于图像区域分割和置信传播的匹配算法.采用均值偏移对参考图像进行区域分割,通过自适应权值匹配计算初始视差图,对各分割区域的初始视差用平面模型拟合得到视差平面参数,使用基于区域的改进置信传播算法求得各区域的最优视差平面,从而得到最终视差图.与全局优化的经典置信传播算法和图割算法的对比实验结果表明,该算法能降低低纹理区域和遮挡区域的误匹配率.  相似文献   

17.
文章提出一种对灰度图像进行色彩传递的算法,首先利用Mean-shift方法对参考图像和目标图像进行分割,然后在空lαβ间利用灰度的统计信息,找到每个目标图像块相对应的参考图像块,分别进行局部色彩传递,得到一幅只有局部上色的彩色图像,最后通过色彩扩展算法,完成整幅灰度目标图像的自动彩色化过程,实验证明,该算法提高了色彩传递的准确性,且得到的彩色化目标图像色彩细腻均匀.  相似文献   

18.
一种基于节点密度分割和标签传播的Web页面挖掘方法   总被引:1,自引:0,他引:1  
获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略了Web页面中文本和链接的内在语义关系,同时降低了页面处理的效率.文中提出了一种Web页面重要内容挖掘的统一框架,该框架主要由3个部分组成:第一,先将Web页面转换为DOM树表示,然后采用节点密度熵为度量将DOM树分割为不同的页面块;第二,采用基于K最近邻标签传播的半监督方法自动扩展页面块训练集;第三,在扩展的页面块训练集上对SVM分类器进行训练,并用来对页面块进行分类.采用该框架可以将Web页面块区分为多种类型,并且该框架独立于Web页面的类型和布局.我们在真实的Web环境下进行了广泛的实验,实验结果表明了该方法的有效性.  相似文献   

19.
TBL是一种被广泛应用于自然语言处理的基于转换的机器学习算法,将这种算法扩展到OCR领域,用来进行字符分割的计算.字符分割是字符识别的一个步骤,它的准确度在一定程度上关系到最终识别结果.为了比较试验的结果,收集了很多的手写字体,通过规则的提取和应用,在探测分段边界过程中也能达到令人满意的结果.  相似文献   

20.
虚拟现实的图形生成技术   总被引:37,自引:1,他引:37       下载免费PDF全文
虚拟现实是一种高度逼真的模拟人在自然环境中视、听、动等行为的人机界面。图形生成是虚拟现实技术的重要瓶颈。本文对面向虚拟现实的实时图形生成技术及其发展情况作了详细的介绍和综述。其主要内容是图形生成的硬件体系结构以及在虚拟现实的真实感图形生成中用于加速的各种有效技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号