首页 | 本学科首页   官方微博 | 高级检索  
     

一种分类型矩阵数据的初始聚类中心选择算法
引用本文:田璐,曹付元,余丽琴.一种分类型矩阵数据的初始聚类中心选择算法[J].计算机工程,2020,46(5):115-121.
作者姓名:田璐  曹付元  余丽琴
作者单位:山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室,太原030006;山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室,太原030006;山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室,太原030006
基金项目:山西省重点研发计划项目;山西省留学基金;国家自然科学基金
摘    要:现有面向矩阵数据集的算法多数通过随机选取初始类中心得到聚类结果。为克服不同初始类中心对聚类结果的影响,针对分类型矩阵数据,提出一种新的初始聚类中心选择算法。根据属性值的频率定义矩阵对象的密度和矩阵对象间的距离,扩展最大最小距离算法,从而实现初始类中心的选择。在7个真实数据集上的实验结果表明,与初始类中心选择算法CAOICACD和BAIICACD相比,该算法均具有较优的聚类效果。

关 键 词:分类型矩阵  矩阵对象  初始聚类中心  密度  数据集

An Initial Cluster Center Selection Algorithm for Categorical Matrix Data
TIAN Lu,CAO Fuyuan,YU Liqin.An Initial Cluster Center Selection Algorithm for Categorical Matrix Data[J].Computer Engineering,2020,46(5):115-121.
Authors:TIAN Lu  CAO Fuyuan  YU Liqin
Affiliation:(School of Computer and Information Technology,Shanxi University,Taiyuan 030006,China;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Taiyuan 030006,China)
Abstract:Most of the existing algorithms for matrix datasets obtain clustering results by randomly selecting the initial cluster center.In order to overcome the influence of different initial cluster centers on the clustering results,this paper proposes a new initial cluster center selection algorithm for categorical matrix data.The density of the matrix objects and the distance between the matrix objects are defined according to the frequency of the attribute values,and the maximum and minimum distance algorithms are extended to realize the selection of the initial cluster center.Experimental results on seven real datasets show that the algorithm has better clustering effect than the initial cluster center selection algorithms CAOICACD and BAIICACD.
Keywords:categorical matrix  matrix object  initial cluster center  density  datasets
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号