首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向不完备信息系统的集对k-means聚类算法
引用本文:张春英,高瑞艳,刘凤春,王佳昊,陈松,冯晓泽,任静.一种面向不完备信息系统的集对k-means聚类算法[J].数据采集与处理,2020,35(4):613-629.
作者姓名:张春英  高瑞艳  刘凤春  王佳昊  陈松  冯晓泽  任静
作者单位:华北理工大学理学院,唐山,063210;河北省数据科学与应用重点实验室,唐山,063210;华北理工大学理学院,唐山,063210;华北理工大学迁安学院,唐山,063210
基金项目:河北省自然科学基金(F2018209374,F2016209344)资助项目。
摘    要:针对不完备信息系统的数据聚类问题,将集对分析理论引入k-means聚类中,同时为了更好地表示样本与类簇的关系,构建了一种面向不完备信息系统的集对k-means (Set pair k-means,SPKM)聚类算法。首先,基于集对理论提出了一种集对距离度量方法,并将该度量方法运用到k-means算法中,得到初步聚类结果;随后,对于同时属于多个类的样本,将其分配到相应类的边界域,对于只属于一个类的样本,将其分配到相应类的正同域或边界域,其中聚类结果由肯定属于该类簇的正同域、可能属于该类簇的边界域以及肯定不属于该类簇的负反域3个部分共同表示;最后通过选取UCI数据库中的6个数据集与4种对比算法进行实验评价。实验结果表明,SPKM算法在准确率、F1值、Jaccard系数、FMI和ARI等指标上均具有良好的聚类性能。

关 键 词:集对信息粒  不完备信息  k-means  集对距离度量  集对k-means聚类
收稿时间:2020/4/30 0:00:00
修稿时间:2020/7/10 0:00:00

A Set Pair k-means Clustering Algorithm for Incomplete Information System
ZHANG Chunying,GAO Ruiyan,LIU Fengchun,WANG Jiahao,CHEN Song,FENG Xiaoze,Ren Jing.A Set Pair k-means Clustering Algorithm for Incomplete Information System[J].Journal of Data Acquisition & Processing,2020,35(4):613-629.
Authors:ZHANG Chunying  GAO Ruiyan  LIU Fengchun  WANG Jiahao  CHEN Song  FENG Xiaoze  Ren Jing
Abstract:
Keywords:set pair information granule  incomplete information  k-means  set pair distance measurement  set pair k-means clustering
本文献已被 万方数据 等数据库收录!
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号