共查询到20条相似文献,搜索用时 0 毫秒
1.
图像的自动标注是图像检索领域一项基础而又富有挑战性的任务。深度学习算法自提出以来在图像和文本识别领域取得了巨大的成功,是一种解决"语义鸿沟"问题的有效方法。图像标注问题可以分解为基于图像与标签相关关系的基本图像标注和基于标注词汇共生关系的标注改善两个过程。文中将基本图像标注问题视为一个多标记学习问题,图像的标签先验知识作为深度神经网络的监督信息。在得到基本标注词汇的基础上,利用原始图像标签词汇的依赖关系与先验分布改善了图像的标注结果。最后将所提出的改进的深度学习模型应用于Corel和ESP图像数据集,验证了该模型框架及所提出的解决方案的有效性。 相似文献
2.
提出一种统一的图像自动分割模型。为了将图像分为颜色、纹理相近的不同的区域,提出了一个处理方法,具体分为两个步骤:首先,用改进的简单线性迭代聚类算法对输入图像进行预处理,即过分割;然后,用其低阶颜色矩表示这些区域的特征,并进一步利用近邻传播聚类算法将这些区域进行合并。在公开的数据集上进行了详细的实验,结果证明了所提算法的有效性和健壮性。 相似文献
3.
In this paper, we introduce a generalized asymmetric fronts propagation model based on the geodesic distance maps and the Eikonal partial differential equations. One of the key ingredients for the computation of the geodesic distance map is the geodesic metric, which can govern the action of the geodesic distance level set propagation. We consider a Finsler metric with the Randers form, through which the asymmetry and anisotropy enhancements can be taken into account to prevent the fronts leaking problem during the fronts propagation. These enhancements can be derived from the image edge-dependent vector field such as the gradient vector flow. The numerical implementations are carried out by the Finsler variant of the fast marching method, leading to very efficient interactive segmentation schemes. We apply the proposed Finsler fronts propagation model to image segmentation applications. Specifically, the foreground and background segmentation is implemented by the Voronoi index map. In addition, for the application of tubularity segmentation, we exploit the level set lines of the geodesic distance map associated with the proposed Finsler metric providing that a thresholding value is given. 相似文献
4.
《计算机辅助设计与图形学学报》2015,(10)
针对前景和背景深度交叠或相机运动时基于深度统计的传统视频分割算法中存在的问题,提出一种基于时空测地线的方法,并证明该方法适合基于深度的视频分割.首先使用基于运动检测的方式进行初始化;然后使用基于特征点选择方式定义种子结点,特征点匹配方式构建时域链接,空间上8邻域像素连接形成空域链接,在连续两帧之间构建时空测地线传播图;最后在时空测地线传播图上使用泛化测地线距离变换将前一帧的分割结果传播到当前帧,并自适应地在传播和检测间切换消除累计误差.实验结果表明,该方法能够在复杂场景和相机运动情形下输出稳定的分割结果. 相似文献
5.
6.
7.
8.
基于多代表点近邻传播聚类算法,提出一种有效的大数据图像的快速分割算法。
该算法首先运用均值漂移算法将彩色图像分割成很多小的同质区域,然后计算每个区域中所有
像素的颜色向量平均值,并用区域数目代替原图像像素点数目,选用区域间的距离作为相似度
的测度指标,最后应用多代表点近邻传播聚类算法在区域相似度矩阵上进行二次聚类,得到最
终的图像分割结果。实验结果证明,提出的算法在大数据图像的分割中取得了较为满意的分割
效果,且分割效率较高。 相似文献
9.
Danilov V. V. Gerget O. M. Skirnevskiy I. P. Manakov R. A. Kolpashchikov D. Yu. 《Programming and Computer Software》2020,46(3):195-206
Programming and Computer Software - This paper describes a new method for medical data segmentation based on superpixel propagation. The proposed method is a modification of the classical region... 相似文献
10.
11.
12.
改进近邻传播聚类的彩色图像分割 总被引:2,自引:0,他引:2
针对近邻传播(AP)聚类算法存在运算时间长、空间复杂度高而难以应用于较大规模图像数据处理的问题,提出一种将mean shift(MS)算法和AP算法相结合的彩色图像分割方法——MSAP算法.首先应用MS算法对输入目标图像进行预分割,将分割后的区域数目代替原图像像素点数目作为AP算法输入数据的规模,计算每个区域中所有像素的彩色向量平均值,并将其作为AP算法输入的数据点,选用数据点间的距离作为相似度的测度指标;然后应用AP算法在数据相似度矩阵上进行聚类,得到最终的图像分割结果.实验结果表明,与AP算法相比,MSAP算法在运行时间和分割效果方面都有显著的提高. 相似文献
13.
图像语义的自动标注是一个具有挑战性的研究课题,目前常见的机器学习方法,如统计生成模型(generative model)与判别模型(discriminative model)都被用于该问题的研究中.然而由于语义鸿沟的存在、图像训练数据的不平衡性以及图像标注的多标签特性等问题,使得上述方法的性能都有待进一步提高.提出一种基于可判别超平面树的生成模型图像标注方法.该方法根据待标注目标图像的高生成概率邻域,建立局部超平面分类树,进而利用同层类间可判别信息,按自顶向下的层次分类得到待标注图像的语义相关图像集合.由此得到的相关类信息与新的生成模型框架相结合对待标注图像与语义关键词的联合概率进行估计,实现对目标图像的标注.其特点在于生成模型与判别模型方法得到了有效结合,可判别超平面树对隐含语义聚类的判别分析是对待标注图像的生成"邻域"的逐步求精过程,有效地提高了生成模型标注准确度;而对于判别分析难以解决的多标签分类、训练数据不平衡等问题,此方法通过联合概率估计自然地实现目标图像的多标签分配.在常用的包含5 000幅图像的ECCV2002数据集进行了实验,结果表明,与目前已知的具有较好标注效果的基于生成模型的MBRM模型(采用图像分割方法)以及基于辨别分析的ASVM-MIL相比,此方法的F1因子分别提高了14%和13%. 相似文献
14.
虽然图像语义分割因其有助于更好地分析和理解图像而被广泛应用于多个领域,但是基于全卷积神经网络的模型在语义分割方面依然存在分辨率重构及如何利用上下文信息的问题.因此,文中提出基于语义传播与前/背景感知的图像语义分割网络.首先,提出联合语义传播上采样模块,提取高层特征的全局语义信息与局部语义信息,用于得到语义权重,将高层特... 相似文献
15.
目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息,探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型。通过长时匹配模块和短时匹配模块分别与第一帧和前一帧做相关操作进行像素级匹配,得到的全局相似性图和局部相似性图,以及前一帧的掩模和当前帧的特征图,经过两个优化网络后通过分割网络得到分割结果。在视频目标分割公开数据集上的实验表明,所提出方法在单目标和多目标上分别取得了86.5%和77.4%的区域相似度和轮廓精度均值,每秒可计算21帧。提出的短时匹配模块比仅使用掩模更有利于提取前一帧的信息,通过长时匹配模块和短时匹配模块的结合,不使用在线微调即可实现高效的视频目标分割,适合应用于移动机器人视觉感知。 相似文献
16.
传统基于像素的立体匹配算法误匹配率较高.为解决该问题,提出一种基于图像区域分割和置信传播的匹配算法.采用均值偏移对参考图像进行区域分割,通过自适应权值匹配计算初始视差图,对各分割区域的初始视差用平面模型拟合得到视差平面参数,使用基于区域的改进置信传播算法求得各区域的最优视差平面,从而得到最终视差图.与全局优化的经典置信传播算法和图割算法的对比实验结果表明,该算法能降低低纹理区域和遮挡区域的误匹配率. 相似文献
17.
18.
一种基于节点密度分割和标签传播的Web页面挖掘方法 总被引:1,自引:0,他引:1
获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略了Web页面中文本和链接的内在语义关系,同时降低了页面处理的效率.文中提出了一种Web页面重要内容挖掘的统一框架,该框架主要由3个部分组成:第一,先将Web页面转换为DOM树表示,然后采用节点密度熵为度量将DOM树分割为不同的页面块;第二,采用基于K最近邻标签传播的半监督方法自动扩展页面块训练集;第三,在扩展的页面块训练集上对SVM分类器进行训练,并用来对页面块进行分类.采用该框架可以将Web页面块区分为多种类型,并且该框架独立于Web页面的类型和布局.我们在真实的Web环境下进行了广泛的实验,实验结果表明了该方法的有效性. 相似文献
19.
TBL是一种被广泛应用于自然语言处理的基于转换的机器学习算法,将这种算法扩展到OCR领域,用来进行字符分割的计算.字符分割是字符识别的一个步骤,它的准确度在一定程度上关系到最终识别结果.为了比较试验的结果,收集了很多的手写字体,通过规则的提取和应用,在探测分段边界过程中也能达到令人满意的结果. 相似文献
20.
虚拟现实是一种高度逼真的模拟人在自然环境中视、听、动等行为的人机界面。图形生成是虚拟现实技术的重要瓶颈。本文对面向虚拟现实的实时图形生成技术及其发展情况作了详细的介绍和综述。其主要内容是图形生成的硬件体系结构以及在虚拟现实的真实感图形生成中用于加速的各种有效技术。 相似文献