人脸聚类是人脸标注、人脸识别等工作的预处理过程。其主要对人脸图像进行分组,用来为人脸识别模型提供高质量的标注信息,从而有效降低人工标注的成本。人脸聚类的关键在于如何学习大规模人脸数据中整体及局部的结构关系,并把其迁移至待标注数据集。针对这一问题,本文提出一种基于近邻关系聚合的人脸聚类方法(Nearest Neighborhood Aggregation Clustering, NNAC)。该方法把局部结构的学习建模为一个近邻关系预测问题,通过堆叠多个改进的基于残差-全连接模块(Residual Fully-Connected Block, ResFCB)以提取多尺度的邻接关系特征。实验结果表明,相比主流人脸聚类方法,该方法在基准数据集上能够有效提升聚类精度。  相似文献   

针对卷积层存在的特征冗余问题,提出了一种基于卷积神经网络的特征图聚类方法。首先通过预训练网络参数提取网络最后一层卷积层的特征图,然后对特征图进行聚类操作,取聚类中心构成新的特征图集合,以聚类后的特征图集作为数据集训练分类器。将有监督的深度学习方法与传统的机器学习方法相结合,使用特征图聚类进行特征去冗余让网络学习到更有效的特征。去冗余后的特征使用神经网络分类器在fer2013测试集上达到了71.67%准确率,在CK+测试集上达到86.98%准确率,证明了该人脸表情识别方法的有效性。  相似文献   

提出一种将粗糙集方法与模糊C均值聚类(FCM)算法结合的图像聚类方法。借助于粗糙集理论在处理大数据量、消除冗余信息等方面的优点,减少模糊C均值聚类的训练数据量,克服其因为数据量大而处理速度慢等缺点,同时利用模糊C均值聚类好的聚类性能,对经过约简的最小属性子集进行聚类分析,实现图像聚类的快速、准确、鲁棒等优点。在人脸图像上的聚类实验取得了很好的效果。  相似文献   

主要针对那些实体类标号属性未知的社会网络进行链接预测.由于实体的类标号属性与具体的社会网络有关,因此具体解决对作者之间合著关系网络图的链接预测问题.首先,给出了合著关系图的结构表示,然后把一个作者是否是多产的定义为合著关系图中作者实体的类标号属性.另外,还提出了一种改进的利用有指导学习进行链接预测的方法.在改进的链接预测方法中为每对作者新引入了一个特征属性--是否至少有一个是多产的.当所要预测的合著关系图中作者实体的类标号属性不完全已知时,用改进后的ICCLP算法对合著关系进行预测,以提高链接预测的性能.改进后的ICCLP算法中采用上面提到的改进后的链接预测方法.  相似文献   

提出了一种基于聚类的人脸图像检索算法. 首先利用归一化分割(Normalized cuts, NCuts)在每个时间段内分别对人脸聚类, 使同一个人在不同情况下的人脸图像聚为一类. 其次采用连续AdaBoost算法学习得到的人脸识别分类器度量人脸之间的相似度, 并进一步提出查询人脸与人脸聚类之间的相似度用于检索. 为了进一步提高性能, 用户可以在线标定错检和漏检的结果, 相关反馈环节把用户的交互标定结果作为约束条件重新对人脸聚类. 本文把人脸图像检索算法应用于自动的检索系统中, 在包含超过一千张人脸图像的家庭数码相册上, 通过与其他方法的对比实验证明了基于聚类的人脸图像检索算法是有效的.  相似文献   

针对图像检索中的语义鸿沟问题,提出了一种新颖的自动图像标注方法。该方法首先采用了一种基于软约束的半监督图像聚类算法(SHMRF-Kmeans)对已标注图像的区域进行语义聚类,这种聚类方法可以同时考虑图像的视觉信息和语义信息。并利用图算法——Manifold排序学习算法充分发掘语义概念与区域聚类中心的关系,得到两者的联合概率关系表。然后利用此概率关系表标注未知标注的图像。该方法与以前的方法相比可以更加充分地结合图像的视觉特征和高层语义。通过在通用图像集上的实验结果表明,本文提出的自动图像标注方法是有效的。  相似文献   

利用网络新闻图像以及与图像相关的文字说明构造一个有人名标注的人脸库.人脸库中的人脸通过对新闻图像进行人脸检测得到,人名从与图像相关的文字说明中提取得到.通过一个聚类过程得到人脸与人名之间的对应关系,并通过一个合并聚类的过程可以识别出同一个人的不同名字.对AP聚类算法进行改进,实验表明相比于k-means与AP算法,改进的AP聚类算法能充分利用网络新闻图文互补的特性,从而得到更准确的人脸与人名对应关系.  相似文献   

谱聚类是一种有效的子空间聚类方法被广泛应用于图像聚类、图像分割等领域中。然而,谱聚类方法的性能在一定程度上依赖于图的构建,因此如何构建有效的图成为谱聚类中的关键问题。为了解决现有图构建方法存在的不足,提出一种基于多局部约束的自表示图构建方法。该方法不仅考虑样本的自表示能力,而且考虑样本的局部结构信息。尤为重要的是,在构建局部约束项时,通过自适应加权方式融合多种不同距离度量准则。提出一种迭代优化算法求解目标函数。在三个标准人脸数据库上,验证了该方法的有效性。  相似文献   

流形学习算法在构造图模型时假设观测数据来自一个光滑的流形采样,但实际高维数据中由于各种因素经常存在噪声或异常值.针对概念分解算法无法有效地处理数据中存在的噪声问题,同时未考虑数据间的几何结构信息问题,提出一种基于稀疏约束的流形正则化概念分解算法.该算法通过l2,1范数对目标函数进行稀疏约束,得到具有鉴别能力的特征向量;同时构建拉普拉斯图正则项获得数据的流形结构信息,提高算法的鉴别能力.最后对文中算法的目标函数进行求解并证明了其收敛性;在PIE人脸库、ATT人脸库、Reuters文本库和TDT2文本库上的实验结果表明,该算法提高了聚类的准确率和归一化互信息.  相似文献   

为了正确检测人脸区域、提高驾驶室内光照不足情况下人脸检测与定位方法的准确性和实时性,采用了肤色聚类的人脸检测方法,利用肤色聚类性将彩色图像分割成皮肤区和非皮肤区。同时,提出一种基于多尺度Retinex算法的改进算法,其能够在人脸检测之前对图像进行光照补偿处理。将改进后的算法应用到新建立的人脸图像库中进行仿真实验,并与传统的肤色聚类人脸检测方法进行对比,其正确率提高了4.7%。实验结果表明:改进后的肤色聚类人脸检测算法可实现对不同光照变化和旋转角度的人脸进行检测,且具有很强的实用价值。  相似文献   

目前很多处理图数据的图神经网络方法被提出,然而大多数研究侧重于对特征聚合的卷积层的研究而不是进行下采样的池化层.此外,形成聚类簇的池化方式需要额外计算分配矩阵;节点得分的池化方式排名方式单一.为解决上述问题,提高图分类任务的准确性,本文提出了一种新的基于多维度信息的图池化算子MDPool.该模型使用节点特征信息以及图拓扑结构信息,获取不同维度下的节点得分.使用注意力机制归纳不同维度下的得分权重,生成更为健壮的节点排名,基于节点排名自适应选择节点集合生成诱导子图.提出的MDPool可以集成到多种的图神经网络结构,将MDPool池化算子与图神经网络卷积层堆叠形成编码解码模型EDMDPool.在4个公开数据集的图分类任务中, EDMDPool均高于现有基线模型.  相似文献   

关注分布式图计算和迭代计算处理方法选择,对计算机技术应用和改善计算机性能等方面具有现实意义。传统算法计算分布式图时,切割率最小化与负载均衡性方面无法实现协调控制,且极易出现NP组合优化等系列问题。因此,以平衡图划分算法为手段,解决分布式图计算问题,重点研究平衡系数、切割边规模。扰动次数一定的条件下,引入Metis,结合平衡图划分算法,进行试验对比分析。通过对比可以发现,该算法下的分布式图割边率计算准确性高于Metis,可以满足分布式图的实际计算需求,这说明平衡图划分算法具有实践应用价值。  相似文献   

When looking at drawings of graphs, questions about graph density, community structures, local clustering and other graph properties may be of critical importance for analysis. While graph layout algorithms have focused on minimizing edge crossing, symmetry, and other such layout properties, there is not much known about how these algorithms relate to a user's ability to perceive graph properties for a given graph layout. In this study, we apply previously established methodologies for perceptual analysis to identify which graph drawing layout will help the user best perceive a particular graph property. We conduct a large scale (n = 588) crowdsourced experiment to investigate whether the perception of two graph properties (graph density and average local clustering coefficient) can be modeled using Weber's law. We study three graph layout algorithms from three representative classes (Force Directed ‐ FD, Circular, and Multi‐Dimensional Scaling ‐ MDS), and the results of this experiment establish the precision of judgment for these graph layouts and properties. Our findings demonstrate that the perception of graph density can be modeled with Weber's law. Furthermore, the perception of the average clustering coefficient can be modeled as an inverse of Weber's law, and the MDS layout showed a significantly different precision of judgment than the FD layout.  相似文献   

Searching application programming interfaces (APIs) is very important for developers to reuse software projects. Existing natural language based API search mainly faces the following challenges. 1) More accurate results are required as software projects evolve to be more heterogeneous and complex. 2) The semantic relationships between APIs (e.g., inheritances between classes, and invocations between methods) need to be illustrated so that developers can better understand their usage scenarios. To deal with these issues, we propose GeAPI, a novel graph embedding based approach for API graph search and recommendation in this paper. First, we build a software project's API graph automatically from its source code and represent each API using graph embedding methods. Second, we search the API graph with a question in natural language, and return the corresponding subgraph that is composed of relevant code elements and their associated relationships, as the best answer of the question. In experiments, we select three well-known open source projects, JodaTime, Apache Lucene and POI, as examples to perform API search tasks. The experimental results show that our approach GeAPI improves F1-score by 10% compared with the existing shortest path based API search approach, while reduces the average response time about 60 times.  相似文献   

Keyword query processing over graph structured data is beneficial across various real world applications. The basic unit, of search and retrieval, in keyword search over graph, is a structure (interconnection of nodes) that connects all the query keywords. This new answering paradigm, in contrast to single web page results given by search engines, brings forth new challenges for ranking. In this paper, we propose a simple but effective Fuzzy set theory based Ranking measure, called FRank. Fuzzy sets acknowledge the contribution of each individual query keyword, discretely, to enumerate node relevance. A novel aggregation operator is defined, to combine the content relevance based fuzzy sets and, compute query dependent edge weights. The final rank, of an answer, is computed by non-monotonic addition of edge weights, as per their relevance to keyword query. FRank evaluates each answer based on the distribution of query keywords and structural connectivity between those keywords. An extensive empirical analysis shows superior performance by our proposed ranking measure as compared to the ranking measures adopted by current approaches in the literature.  相似文献   

张丽霞  王伟平  高建良  王建新 《软件学报》2015,26(11):2964-2980
在大数据时代,数据图的规模急剧增长,增量图模式匹配算法能够在数据图或模式图发生变化时避免重新在整个数据图上进行匹配、减少响应时间,因此成为了研究的热点.针对实际应用中数据图不变而模式图发生变化的情况,提出了一种面向模式图变化的增量图模式匹配算法PGC_IncGPM,在模式图匹配的过程中记录适当的中间结果作为索引,用于后续的模式匹配.提出了增强的图模式匹配算法GPMS,用于首次整个数据图上的模式匹配.该算法一方面能够建立后续增量匹配所需的索引,另一方面减少了整个数据图匹配的执行时间.设计实现了面向模式图增边和减边的两个核心子算法,通过子算法的组合,能够支持在模式图发生各种变化时进行增量图模式匹配.在真实数据集和合成数据集上进行实验,结果表明:与重新在整个数据图上进行匹配的ReComputing算法相比,当模式图中变化的边的数目不超过不变的边的数目时,PGC_IncGPM算法能够有效减少图模式匹配的执行时间;随着数据图规模的增大,PGC_IncGPM算法相对于ReComputing算法的执行时间的减少程度更加明显,对于大规模数据图具有更好的适用性.  相似文献   

The Giant Global Graph is an excellent perspective on how we can consider diverse pieces of Web infrastructure as a conceptual whole. The Web, when augmented with RDF's graph model, provides an interconnected system. The resources on the semantic Web are interconnected through logical predicates, but this layer exists on top of the coupling offered by the link, as built into the Web since day one. Resources can be identified with URIs designed for HTTP, and the primary Web mechanism is that of using HTTP to get representations of those resources.  相似文献   

In this survey we overview the definitions and methods for graph clustering, that is, finding sets of “related” vertices in graphs. We review the many definitions for what is a cluster in a graph and measures of cluster quality. Then we present global algorithms for producing a clustering for the entire vertex set of an input graph, after which we discuss the task of identifying a cluster for a specific seed vertex by local computation. Some ideas on the application areas of graph clustering algorithms are given. We also address the problematics of evaluating clusterings and benchmarking cluster algorithms.  相似文献   

Summary We develop a complexity theory based on the concept of the graph instead of the Boolean function. We show its relation to the Boolean complexity and prove some lower bounds to the complexity of explicitly given graphs.The paper was written while the first author was visiting Department of Mathematics, Statistics and Computer Science, University of Illinois at Chicago  相似文献   

