共查询到20条相似文献,搜索用时 62 毫秒
1.
聚类集成比单个聚类方法具有更高的鲁棒性和精确性,它主要由两部分组成,即个体成员的产生和结果的融合。针对聚类集成,首先用k-means聚类算法得到个体成员,然后使用层次聚类中的单连接法、全连接法与平均连接法进行融合。为了评价聚类集成方法的性能,实验中使用了ARI(Adjusted Rand Index)。实验结果表明,平均连接法的聚类集成性能优于单连接法和全连接法。研究并讨论了融合方法的聚类正确率和集成规模的关系。 相似文献
2.
聚类集成算法通常对聚类成员差异性要求较高,导致算法在生成聚类成员阶段计算复杂度提高。针对该问题提出了一种基于遗传算法的聚类集成方法CEGA,不考虑聚类成员的差异性,而是利用目标函数将聚类问题转化为聚类成员的优化问题,充分利用遗传算法内在的并行性和全局寻优能力,对聚类成员进行优化组合,并以得到的最优染色体作为聚类集成最终结果。分析了CEGA的复杂度及适用范围,并利用UCI数据库中部分数据集进行实验,实验结果表明这种聚类集成方法的有效性。 相似文献
3.
随着信息结构的日益复杂,单种聚类算法已经无法满足需求,集成聚类便发挥了巨大的作用。对于不同的划分,当前集成聚类算法都将其视为整体,其过程中会有信息损失。利用局部一致的特性,局部一致性集成聚类算法在非负矩阵分解的框架下得以产生。实验结果表明了该方法的有效性。 相似文献
4.
5.
针对传统的聚类集成算法难以高效地处理海量数据的聚类分析问题,提出一种基于MapReduce的并行FCM聚类集成算法。算法利用随机初始聚心来获取具有差异化的聚类成员,通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,最后利用投票法共享聚类成员中数据对象的分类情况得出最终的聚类结果。实验证明,该算法具有良好的精确度,加速比和扩展性,具有处理较大规模数据集的能力。 相似文献
6.
一种改进的自适应聚类集成选择方法 总被引:1,自引:0,他引:1
针对自适应聚类集成选择方法(Adaptive cluster ensemble selection,ACES)存在聚类集体稳定性判定方法不客观和聚类成员选择方法不够合理的问题,提出了一种改进的自适应聚类集成选择方法(Improved ACES,IACES).IACES依据聚类集体的整体平均归一化互信息值判定聚类集体稳定性,若稳定则选择具有较高质量和适中差异性的聚类成员,否则选择质量较高的聚类成员.在多组基准数据集上的实验结果验证了IACES方法的有效性:1)IACES能够准确判定聚类集体的稳定性,而ACES会将某些不稳定的聚类集体误判为稳定;2)与其他聚类成员选择方法相比,根据IACES选择聚类成员进行集成在绝大部分情况下都获得了更佳的聚类结果,在所有数据集上都获得了更优的平均聚类结果. 相似文献
7.
半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、 kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。 相似文献
8.
当前流行的聚类集成算法无法依据不同数据集的不同特点给出恰当的处理方案,为此提出一种新的基于数据集特点的增强聚类集成算法,该算法由基聚类器的生成、基聚类器的选择与共识函数构成。该算法依据数据集的特点,通过启发式方法,选出合适的基聚类器,构建最终的基聚类器集合,并产生最终聚类结果。实验中,对ecoli,leukaemia与Vehicle三个基准数据集进行了聚类,所提出算法的聚类误差分别是0.014,0.489,0.479,同基于Bagging的结构化集成(BSEA)、异构聚类集成(HCE)和基于聚类的集成分类(COEC)算法相比,所提出算法的聚类误差始终最低;而在增加候基聚类器的情况下,所提出算法的标准化互信息(NMI)值始终高于对比算法。实验结果表明,同对比的聚类集成算法相比,所提出算法的聚类精度最高,可伸缩性最强。 相似文献
9.
《计算机应用与软件》2017,(9)
聚类集成是将一个数据集的多个划分(基聚类)合成一个新的聚类,该聚类最大程度地代表了所有输入基聚类对数据集的聚类信息。显而易见,初始基聚类的质量对于最终的集成划分至关重要。传统的聚类集成中的基聚类器使用最多的是K-means,因为K-means不仅实现简单,计算复杂度不高,而且其聚类机制符合机器学习关于局部数据的类别条件概率为常数的假设。但由于K-means通常直接使用高斯距离作为距离测度,其只能发现球形簇的类;而对于具有结构复杂、尤其是基于连接性且非球形分布的类结构的数据集,不能生成高质量(即同质性高)的基聚类。为此提出一个基聚类的优化方法,即:判定K-means所生成类的同质性,对同质性较差的类进行再次划分,以提高基聚类的同质性,从而提高整个聚类集成的质量。在8个数据集上的实验数据表明所提出的方法是有效的。 相似文献
11.
Minglun Gong Ruigang Yang Liang Wang Mingwei Gong 《International Journal of Computer Vision》2007,75(2):283-296
Many vision applications require high-accuracy dense disparity maps in real-time and online. Due to time constraint, most
real-time stereo applications rely on local winner-takes-all optimization in the disparity computation process. These local
approaches are generally outperformed by offline global optimization based algorithms. However, recent research shows that,
through carefully selecting and aggregating the matching costs of neighboring pixels, the disparity maps produced by a local
approach can be more accurate than those generated by many global optimization techniques. We are therefore motivated to investigate
whether these cost aggregation approaches can be adopted in real-time stereo applications and, if so, how well they perform
under the real-time constraint. The evaluation is conducted on a real-time stereo platform, which utilizes the processing
power of programmable graphics hardware. Six recent cost aggregation approaches are implemented and optimized for graphics
hardware so that real-time speed can be achieved. The performances of these aggregation approaches in terms of both processing
speed and result quality are reported. 相似文献
12.
13.
14.
15.
Radko Mesiar 《Information Sciences》2008,178(18):3557-3564
Infinitary aggregation functions acting on sequences and possessing some a priori given properties as additivity, comonotone additivity, symmetry, etc., are investigated. On the other side, we discuss infinitary aggregation functions related to given extended aggregation functions, where special attention is given to triangular norms, triangular conorms and weighted means. 相似文献
16.
业务流程模型抽象的一个最突出的用例是对包含大量元素的业务流程细节模型进行“简要视图”的构造,以便对流程进行快速理解。很多学者对流程抽象方法进行了研究,提出根据行为的语义相似性对行为进行聚合,其中多数研究基于k-means聚类分析,即根据事先指定的抽象行为个数对行为进行聚类,在将行为聚合到某一个行为簇时,选择距离该行为簇的图心最近的行为。但实际上,抽象行为(子流程)个数是一个未知的量,哪些行为属于同一个子流程往往取决于建模者的经验和抽象习惯,而且在聚合时,若行为从业务意义角度或建模者的抽象习惯角度并不属于该子流程,则合并往往会产生抽象错误。因此,引入虚拟文档表示行为和流程模型,以消除固定属性作为表示行为的向量空间维度带来的约束。并且设计算法从大量包含人工设计子流程的真实的业务流程模型库中获取行为与所在子流程的距离阈值,利用该阈值指导生成可能获得的抽象行为个数k。以k为参数对流程模型进行行为聚类,在聚类过程中,进一步利用距离阈值对聚合行为进行限制。对真实的流程模型库进行实验分析,结果表明提出的行为聚类方法更加接近人工设计的抽象结果。 相似文献
17.
Bassel Mannaa 《Information Processing Letters》2010,110(21):961-721
In this paper we consider the cluster editing problem for a special type of graphs, where the vertices represent points on the real line and there is an edge between each two vertices for which the distance between their corresponding points on the line is less than a given constant. We give a polynomial time cluster editing algorithm for this class of graphs. 相似文献
18.
如何将个体理性偏好聚合为群体理性偏好是社会理性认知研究面临的主要难题,判断聚合研究为偏好聚合问题的分析提供了新思路。从逻辑的视角探究判断聚合与偏好聚合之间的关系,分析了判断聚合模态逻辑JAL,证明利用一阶逻辑语言基于JAL可以构建一个偏好聚合的模态逻辑JAL(LK),以将偏好聚合转化为判断聚合来处理,因而判断聚合模型更具一般性。 相似文献
19.
区分服务是目前在IP网络服务质量控制方面被广泛采用的一种体系结构,它在网络边界对用户数据流聚集进行分类、测量、标记和整型,在网络核心转发,实现PHB,从而达到对不同类型的业务进行区别对待的目的.本文通过对UDP和TCP混合聚集流的行为特性分析,指出将UDP和TCP业务进行分离的必要性.通过对TCP聚集流的仿真实验和分析,阐述了TCP聚集流和单个TCP的行为差异、聚集流中具有不同RTT的TCP流的速率差别,以及聚集流中的流的数目和链路带宽对链路利用率的影响.最后通过对TSW2cm标记算法的仿真实验,分析了该算法在公平性方面的弱点,提出了一种基于TCP流状态信息的聚集流标记算法f-TSW2cm,并对算法进行了对比实验和结果分析. 相似文献