首页 | 本学科首页   官方微博 | 高级检索  
     

粗糙集中的距离度量与离群点检测
引用本文:江峰 眭跃飞 曹存根. 粗糙集中的距离度量与离群点检测[J]. 控制与决策, 2013, 28(2): 188-192
作者姓名:江峰 眭跃飞 曹存根
作者单位:1. 青岛科技大学信息科学技术学院,山东青岛266061
2. 中国科学院计算技术研究所,北京100080
基金项目:国家自然科学基金项目(60802042,61103246);山东省自然科学基金项目(ZR2011FQ005,ZR2011FQ026,ZR2010FQ027);山东省高等学校科技计划项目(J11LG05)
摘    要:针对传统的基于距离的离群点检测方法不能有效地处理具有离散型属性数据集的问题,将基于距离的离群点检测方法引入粗糙集理论,利用粗糙集解决离散型属性的处理问题.首先,在粗糙集的框架中提出3种面向离散型属性的距离度量;然后,针对这3种距离度量分别设计出相应的离群点检测算法,用于从包含离散型属性的数据集中检测离群点;最后,通过在2个包含离散型属性的UCI数据集上的实验,验证了这些算法的可行性和有效性.

关 键 词:粗糙集理论  离群点检测  数据挖掘  距离度量  离散型属性
收稿时间:2011-10-17
修稿时间:2012-03-01

Distance metrics and outlier detection in rough sets
JIANG Feng,SUI Yue-fei,CAO Cun-gen. Distance metrics and outlier detection in rough sets[J]. Control and Decision, 2013, 28(2): 188-192
Authors:JIANG Feng  SUI Yue-fei  CAO Cun-gen
Affiliation:1.College of Information Science and Technology,Qingdao University of Science and Technology,Qingdao 266061,China;2.Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080,China.)
Abstract:The traditional distance-based outlier detection method can not effectively deal with the data sets containing
discrete attributes. Therefore, the distance-based outlier detection method to rough sets is introduced, and the advantage of
rough sets is taken to solve the problem of dealing with discrete attributes. First, three distance metrics for discrete attributes
within the framework of rough sets are proposed. Second, for each of these distance metrics, a corresponding outlier detection
algorithm is designed, to detect outliers from data sets containing discrete attributes. Finally, the feasibility and effectiveness
of these algorithms are demonstrated on two UCI data sets containing discrete attributes.
Keywords:rough set theory  outlier detection  data mining  distance metric  discrete attributes
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号