共查询到20条相似文献,搜索用时 10 毫秒
1.
一种改进的模糊聚类算法 总被引:12,自引:1,他引:12
FCM(Fuzzy C-Means)算法是一种基于目标函数优化的模糊聚类方法,其收敛地于初始条件敏感。与HCM(Hard C-Means)算法相比,FCM算法的模糊分割矩阵提供的信息更加丰富。本文采用冗余聚类中心初始化,根据模糊分割矩 列和以及实际的要求逐级减少类别数目。实验结果显示改进的算法得到的收敛中心稳定,并且中以融合有关数据分布的先验知识得到所期望的结果。 相似文献
2.
3.
4.
传统的K-Modes算法采用0-1简单匹配方法计算对象与类中心(Modes)之间的距离,并将每个对象分配到离它最近的类中去。采用基于频率方法重新计算各类的类中心(Modes)、定义目标函数,然而,对象的归类方法和目标函数的定义没有充分考虑分类数据的特点。对此,提出一种改进的K-Modes算法,采用期望熵最小的衡量方法进行归类,并且采用期望熵作为新的目标函数。通过实验将该算法与传统的K-Modes算法进行比较,表明该算法是更有效的。 相似文献
5.
一种改进的特征加权K-means聚类算法 总被引:4,自引:0,他引:4
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据. 相似文献
6.
为了更好地实现聚类,在分析层次聚类(agglomerative)算法和神经网络的ART2算法的基础上,提出了一种改进的层次聚类算法.改进算法将首先采用一种基于ART2的改进神经网络聚类算法得到一个初始的聚类结果,然后在此基础上利用agglomerative算法实现分层聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好. 相似文献
7.
属性图各节点附有的节点属性标签,为节点提供了更加丰富的信息,在数据挖掘应用,特别是数据聚类问题中如何有效利用这些丰富的信息,已经成为开展此类研究的研究目的。不同于传统图聚类,属性图上的聚类要同时考虑图的结构信息和节点的属性信息,因此如何平衡两者之间的关系,这是属性图聚类主要关注所在。目前已提出的属性图聚类算法,部分算法的效率很高,然而聚类质量较差,同时一些算法可以得到较好的聚类结构,然而算法消耗大量的系统资源,效率也较低。这些算法均没有考虑簇之间存在重叠的情况,这导致无法得到更高精度的聚类结构。因而提出一种属性图上的重叠聚类挖掘算法,实验表明,提出的算法可以得到更高的聚类精度,特别是可以提升聚类内部节点的属性相似度。 相似文献
8.
针对检索引擎返回的查询结果数量巨大,用户难以在较短的时间获取有用的信息,传统FCM聚类算法的距离无法完全准确描述文本间的相似程度,本文提出了一种新的文本间的距离定义,改进了模糊C均值聚类(FCM)聚类算法,利用新改进的算法对搜索引擎返回的结果进行聚类,方便了用户查询。实验证明了算法的可行性与有效性。 相似文献
9.
10.
为解决城市道路中相邻车辆聚类精度低的问题,本文提出了一种改进的密度峰值模糊聚类算法。首先,该算法使用自适应椭圆距离代替欧式距离,并在决策图中引入指数函数曲线选择密度峰值点,以确定初始聚类中心和聚类数目;接着,将初始信息代入模糊C均值(FCM)聚类算法中,经迭代计算取得一次聚类结果;最后,根据雷达数据中同一辆车的数据点速度差值极小、不同车辆的速度差值相对较大这一特征,引入和速度相关的目标函数,并通过迭代计算取得最终的聚类结果,以对一次聚类结果进行修正。根据真实道路测量数据的实验证明,本文提出的聚类算法精度高、鲁棒性好,能正确聚类城市道路中相邻的车辆目标,具有更好的聚类效果。为道路中车辆的跟踪、交通状态预估等处理提供可靠、准确的目标信息,大大减少后续工程的计算量。 相似文献
11.
一种改进的K平均聚类算法 总被引:2,自引:0,他引:2
典型K平均算法中的聚类数k必须是事先给定的确定值,然而实际中很难精确确定,因而无法解决该核算法的实际问题.为此,提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此提出了一种改进的k值优化算法.实验证明,与传统基于平均值方法实现数据聚类相比,用改进K值优化算法有效提高数据聚类效果. 相似文献
12.
为了进一步提高计算效率,提出一种面向计算机集群的并行聚类算法.首先合理划分数据块,之后由集群中的节点并行聚类,最后合并聚类结果.这期间采用动态负载平衡和异构的通讯方式.实验证明该并行算法不仅能得到正确的聚类结果,并能够大幅度提高聚类速度. 相似文献
13.
提出了一种改进的蚁群聚类分析算法,通过改进LF算法中群体相似度函数,加入参数的自适应调整策略,利用短期记忆和网格信息素的局部分布控制蚂蚁的随机移动,并结合蚂蚁速度动态变化、半径递增、强制放下等特性。采用测试数据和不同的算法进行了对比实验分析,仿真实验结果表明,该算法显示出了较高的稳定性和准确率。 相似文献
14.
为克服在线视频网站中出现的数据稀疏性和推荐实时性不佳的问题,本文提出一种基于用户聚类的改进算法.首先该算法以商品属性为辅助预填充矩阵空白,然后采用初始聚类中心优化的k-means算法在矩阵上对用户进行离线聚类,将兴趣点相同的用户聚集到同一类别中,最后在线寻找目标用户最近邻并产生推荐.本文采用MovieLens作为测试数据集,实验结果表明,本文算法可以有效缓解数据稀疏性及改善实时性,并在一定程度上提高推荐精度. 相似文献
15.
16.
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果. 相似文献
17.
一种改进的基于密度的聚类算法 总被引:1,自引:0,他引:1
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法. 相似文献
18.
传统的减法聚类算法时间复杂度高,算法不具有分布式特性,不满足大数据处理的要求.提出一种基于Hadoop的改进减法聚类算法,利用MapReduce模型改进减法聚类执行过程,实现求解邻域半径、初始化密度指标、更新密度指标和划分数据记录等过程的并行化.实验结果表明,同传统的串行算法相比,提出的算法能够对大数据进行快速聚类,同时表现出良好的稳定性与扩展性. 相似文献
19.
章三妹 《智能计算机与应用》2017,7(1)
在图像分割过程中采用FCM算法对颜色进行聚类时使用的欧氏距离不能取得好的聚类效果,本文介绍一种改进的基于HIS模型下欧氏距离计算方法,该方法对颜色聚类能取得良好的效果. 相似文献
20.
在先前指标的基础上提出了一种改进的聚类有效性指标,该指标以紧密性和分离性之比定义,不仅体现了数据的隶属度和几何结构的相关信息,同时也反映了数据的分布情况.实验表明,该指标可以使数据集实现正确划分,具有较高的可靠性. 相似文献