共查询到18条相似文献,搜索用时 62 毫秒
1.
一种改进的CURE聚类算法 总被引:2,自引:0,他引:2
聚类分析是数据挖掘领域的一个重要研究方向。已经有多种用于大规模数据库的聚类算法,CURE就是一个典型的代表。本文对CURE进行了改进,新方法用多点表示一个类,但舍弃了代表点收缩的过程;通过对类内最邻近距离统计特征的分析,提出了自动分离子类的方法,因而不用预先给定聚类个数;在CURE对原始数据进行随机采样和分区聚类的基础上,增加了划分网格一步,能降低噪声影响并缩短聚类时间。对二维数据的测试表明:改进的CURE能正确识别大多数类,速度上优于原算法。 相似文献
2.
改进的K-均值聚类算法 总被引:1,自引:0,他引:1
在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,提出了K-均值聚类算法中寻找初始聚类中心的新方法。该算法首先计算出样本间的距离,然后根据样本点之间的距离寻找出有可能是一类的数据,最后依赖这些样本点形成初始聚类中心。 相似文献
3.
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。阐述了聚类算法基本原理,总结了聚类算法的研究现状,按照聚类算法的分类,分析比较了三种典型聚类的性能差异和各自存在的优点及问题,并结合应用需求指出了其今后的发展趋势。 相似文献
4.
对于非球形和其它特殊形状的非凸数据集的聚类,基于划分的聚类算法很难取得理想的聚类结果。层次聚类算法根据数据的特征将距离近的数据进行合并,对于球形数据集和其它具有特殊形状的数据集有很好的聚类效果。在分析现有层次聚类算法的基础上,根据层次聚类的合并思想和最近邻距离的计算提出了基于区域最近邻生长的层次聚类算法。 相似文献
5.
6.
网格计算应用主要针对大规模计算任务,任务调度时为了提高寻找效率,设计了一种多目标最优资源聚类调度方法 MORC(task scheduling algorithm based on multiple-objective optimal resource clustering),利用超图理论构建模型,用遗传算法将多目标转化为单目标,对资源进行聚类预处理;任务调度时以最小执行时间为主要目标,并兼顾资源负载均衡。该方法不但可以有效均衡资源负载,还能够缩短任务与资源的匹配时间,使任务调度的性能大幅度提高。 相似文献
7.
8.
数据挖掘中的聚类在各行各业都有广泛应用,本文提出了基于网格的万有引力聚类算法(GGBCA),通过网格聚类(GBCA)的思想生成一系列的高密度网格,然后对高密度网格进行万有引力聚类,该算法考虑了类的大小对聚类结果的影响,提高了聚类效果。 相似文献
9.
一种基于区间数的扩展FCM聚类算法 总被引:1,自引:0,他引:1
在区间值数据的聚类算法中,区间数之间的距离大多仅考虑两区间数的上下界值,其最大缺陷在于所定义的距离不满足视觉合理性。因此,区间值数据的聚类很难用传统的FCM方法。为了解决这个问题,本文引入了一种新的区间数的距离测度,扩展了一种可直接处理特征空间为区间数的聚类问题的FCM聚类算法。通过对比分析表明,该算法更具合理性及有效性。 相似文献
10.
一种快速全局聚类算法应用于化工建模的数据提取 总被引:1,自引:1,他引:1
分别采用模糊C-均值聚类方法和快速全局C-均值聚类两种算法实现化工建模所需训练数据的有效提取.实验结果表明,采用快速全局C-均值聚类算法在时间和数据的准确及有效性等方面都比模糊C-均值聚类有所提高. 相似文献
11.
基于自组织映射神经网络的聚类分析系统研究 总被引:6,自引:0,他引:6
将自组织影射特征神经网络技术用于工业监控数据聚类分析,并给出聚类算法模型、算法实现步骤,采用VC 程序来实现,通过实验测试和实例数据分析,表明该聚类算法针对工业监控数据存在不确定性、有噪声及多模态性等特点,有较好的鲁棒性和适应性。 相似文献
12.
图是实体及其关系建模的一种常见方法并广泛地运用于Internet,Web结构,社团网络等的结构描述。在面对图中两个邻接结点的度都非常大,而它们连接相同结点的数目极少的问题时,普通聚类方法难以解决。对这一问题,根据图的相异度矩阵计算模型,采用凝聚的层次聚类方法思想,可以进行有效的聚类分析。最后通过实例检验了上述度量标准及聚类算法的正确性和有效性。 相似文献
13.
改进型无线传感器网络安全分簇路由协议 总被引:1,自引:0,他引:1
无线传感器网络路由协议对无线传感器网络起着非常重要的作用,是无线传感器网络的关键技术之一。本文基于经典的LEACH算法提出一种改进型LEACH-R,主要体现在对簇首的考虑上。簇形成阶段引入对加入簇节点的身份验证机制以及对候选簇首广播消息的认证。簇稳定阶段引入簇内节点对簇首广播消息进行认证的机制。计算机仿真对比实验结果表明,LEACH-R协议能够延长网络寿命,使用网络的安全性得到提高,网络性能得到改善。 相似文献
14.
为了解决工程设计中接线箱分配最优化的问题,通过分析和比较各种聚类方法,对模糊C-均值聚类算法进行改进和参数设置,通过初始化、迭代、解模糊及分裂等步骤,实现了接线箱的自动分配功能。并设计了一种基于改进的模糊C-均值聚类算法的接线箱分配辅助软件,可以根据不同要求自动分配接线箱的功能,给出了软件流程,分析了实验结果,并在某设计院项目接线箱的实际布置中成功应用。 相似文献
15.
16.
17.
数据挖掘中应用的技术包括经典的统计、近邻、聚类,也包括最新发展起来的决策树、神经网络和关联规则等一些较新的方法。结合数据挖掘技术在电子商务中的应用,提出选择数据挖掘技术的两个重要依据,以便开发出有效、实用的数据挖掘系统。 相似文献
18.
提出基于时间冗余的不可删显著误差处理方法。对于该类特殊变量,采用线性回归的方法,根据历史数据进行预测,进而代替实际到量值进行协调运算。大大降低显著误差对协调数据的污染,确保协调物度。通过实例数据仿真计算证实该方法的有效性。 相似文献