首页 | 本学科首页   官方微博 | 高级检索  
     

利用子空间划分的局部离群数据挖掘算法
引用本文:刘爱琴,葛凌云,杨海峰,张继福.利用子空间划分的局部离群数据挖掘算法[J].小型微型计算机系统,2011,32(8).
作者姓名:刘爱琴  葛凌云  杨海峰  张继福
作者单位:太原科技大学计算机科学与技术学院,太原,030024
基金项目:国家自然科学基金项目(61073145)资助; 山西省自然科学基金项目(2010011021-2)资助; 山西省回国留学人员科研项目(2009-77)资助
摘    要:目前大多数局部离群数据挖掘算法需人为事先设置参数或阈值,且难以应用到高维数据集.给出一种新的局部离群数据挖掘算法PSO-SPLOF,该算法首先将数据集划分为互不相交的子空间,利用偏斜度判断子空间划分的优劣,并采用微粒群算法搜索最优划分子空间集;其次针对每个最优划分子空间,计算其数据对象的局部离群因子SPLOF值,并用SPLOF值来度量数据对象的局部偏离程度.最后采用离散化的天体光谱数据作为数据集,实验验证了PSO-SPLOF算法具有受人为因素影响小、伸缩性强和运算效率高等优点.

关 键 词:离群数据挖掘  微粒群算法  子空间  划分偏斜度  天体光谱数据  

Local Outlier Mining Algorithm Using Subspace Partitioning
LIU Ai-qin,GE Ling-yun,YANG Hai-feng,ZHANG Ji-fu.Local Outlier Mining Algorithm Using Subspace Partitioning[J].Mini-micro Systems,2011,32(8).
Authors:LIU Ai-qin  GE Ling-yun  YANG Hai-feng  ZHANG Ji-fu
Affiliation:LIU Ai-qin,GE Ling-yun,YANG Hai-feng,ZHANG Ji-fu(School of Computer Science and Technology,Tai-Yuan University of Science and Technology,Taiyuan 030024,China)
Abstract:Most local outlier mining algorithms depend on the parameters that user inputs,and it is difficult to apply to high-dimensional data set.In this paper,a novel algorithm(PSO-SPLOF) of local outlier mining is presented.Firstly,data set is divided into the disjoint subspaces,merits of the subspace partition is measured by skew of partition,and the best partition of the subspaces is searched by using the optimal particle swarm algorithm.Secondly,the local outlier factor(SPLOF) value of data objects is computed ...
Keywords:outlier mining  particle swarm optimization  sub-space  skew of partition  star spectrum  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号