相关子空间中的局部离群数据挖掘算法研究 |
| |
引用本文: | 李永红,张继福,荀亚玲.相关子空间中的局部离群数据挖掘算法研究[J].小型微型计算机系统,2015(3):460-465. |
| |
作者姓名: | 李永红 张继福 荀亚玲 |
| |
作者单位: | 太原科技大学计算机科学与技术学院 |
| |
基金项目: | 国家自然科学基金项目(61272263)资助 |
| |
摘 要: | 针对高维数据集,采用局部稀疏差异和局部密度差异的度量因子,给出一种相关子空间中的局部离群数据挖掘算法.该算法根据K最近邻(K-NN),确定数据集中各数据对象的局部数据集,并依据属性值的稀疏因子生成全局的稀疏因子矩阵和局部稀疏因子矩阵,从而有效地反映了数据对象的局部稀疏程度;根据局部稀疏因子矩阵,计算属性维对应的局部稀疏差异因子,并确定数据对象对应的子空间定义向量,从而体现了具有任意性相关的相关子空间;如果数据对象存在相关子空间,则采用高斯误差函数体现相关子空间中各数据对象的局部密度差异,有效地降低了"维灾"的影响,使得离群数据的度量与相关子空间的维度无关,并能够度量相关子空间的数据对象,否则设置数据对象的局部密度差异为0,表明其为正常数据;选取局部密度差异(离群程度)最大的若干数据对象作为局部离群数据;最后采用UCI和恒星光谱数据集,实验验证了该算法的有效性.
|
关 键 词: | 局部离群数据 高维数据集 局部稀疏差异 局部密度差异 相关子空间 |
本文献已被 CNKI 等数据库收录! |
|