首页 | 本学科首页   官方微博 | 高级检索  
     

基于聚类融合的不平衡数据分类方法
引用本文:陈思,郭躬德,陈黎飞.基于聚类融合的不平衡数据分类方法[J].模式识别与人工智能,2010,23(6).
作者姓名:陈思  郭躬德  陈黎飞
作者单位:1. 福建师范大学,数学与计算机科学学院,福州,350007
2. 福建师范大学,网络安全与密码技术重点实验室,福州,350007
基金项目:教育部留学回国人员基金,福建省自然科学基金
摘    要:不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处于多数类中心区域的样本,并分别使用改进的SMOTE过抽样方法和改进的随机欠抽样方法对训练集的少数类和多数类进行不同的处理,以改善不同类数据的平衡度,为分类算法提供更好的训练平台.通过实验对比8种方法在一些公共数据集上的分类性能,结果表明该方法对少数类和多数类均具有较高的识别率.

关 键 词:不平衡数据  聚类融合  过抽样  欠抽样

Clustering Ensembles Based Classification Method for Imbalanced Data Sets
CHEN Si,GUO Gong-De,CHEN Li-Fei.Clustering Ensembles Based Classification Method for Imbalanced Data Sets[J].Pattern Recognition and Artificial Intelligence,2010,23(6).
Authors:CHEN Si  GUO Gong-De  CHEN Li-Fei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号