首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于相关系数的模糊C-均值聚类算法
引用本文:钟毅. 一种基于相关系数的模糊C-均值聚类算法[J]. 软件产业与工程, 2016, 0(6): 50-53. DOI: 10.3969/j.issn.1674-7933.2016.06.15
作者姓名:钟毅
作者单位:中国银联股份有限公司 上海201201
摘    要:针对传统模糊C-均值聚类算法同等对待每个属性的局限性和初始聚类中心选择的随机性,提出了一种基于相关系数优化的模糊C-均值聚类算法.首先,该算法通过计算离散系数和信息熵来确定每个属性的权重,从而强化了重要属性对聚类过程的影响,削弱了冗余属性的作用,改善了聚类效果;其次,采用相关系数和密度函数来确定样本点的密度,从而突出了样本点在同一类别中的作用;再次,将归一化后的样本点密度作为每个样本的权值;最后,由相关系数及样本点密度确定初始聚类中心.实验结果表明,该算法比传统的FCM算法具有更好的聚类效果.

关 键 词:模糊C均值算法  离散系数  信息熵  属性权重  相关系数  密度函数

A Fuzzy C-Means Clustering Algorithm Based on Correlation Coefficient
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号