面向分类型矩阵数据的无监督孤立点检测算法 |
| |
引用本文: | 吴晓林,曹付元.面向分类型矩阵数据的无监督孤立点检测算法[J].深圳大学学报(理工版),2019(1). |
| |
作者姓名: | 吴晓林 曹付元 |
| |
作者单位: | 山西大学计算机与信息技术学院;山西大学计算智能与中文信息处理教育部重点实验室 |
| |
摘 要: | 孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Market basket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlier factor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点.
|
本文献已被 CNKI 等数据库收录! |
|