一种基于区域划分的数据流子空间聚类方法 |
| |
引用本文: | 于翔,印桂生,许宪东,王建伟.一种基于区域划分的数据流子空间聚类方法[J].计算机研究与发展,2014(1). |
| |
作者姓名: | 于翔 印桂生 许宪东 王建伟 |
| |
作者单位: | 黑龙江工程学院计算机科学与技术学院;哈尔滨工程大学计算机科学与技术学院; |
| |
基金项目: | 国家自然科学基金项目(61272186);黑龙江省教育厅科学技术项目(12531542) |
| |
摘 要: | 数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种新的数据流子空间聚类算法SC-RP,SC-RP无需预先给出聚类数目或特征子空间,对孤立点不敏感,可实现快速聚类,通过区域树结构记录数据流的变化并及时更新统计信息,进而根据数据流的变化调整聚类结果.通过在真实数据集与仿真数据集上的实验,证明了SC-RP在聚类精度和速度上优于现有的数据流子空间聚类算法,且对聚类数目及数据维度均具有良好的伸缩性.
|
关 键 词: | 数据挖掘 数据流 子空间聚类 特征选择 维度约简 |
本文献已被 CNKI 等数据库收录! |
|