基于区间数的不确定数据流2k近邻聚类算法 |
| |
引用本文: | 陆亿红,任胜亮.基于区间数的不确定数据流2k近邻聚类算法[J].浙江工业大学学报,2018(3). |
| |
作者姓名: | 陆亿红 任胜亮 |
| |
作者单位: | 浙江工业大学计算机科学与技术学院 |
| |
摘 要: | 现有数据流聚类算法多数面向的是确定性数据,可是不确定数据的数据流聚类逐步被受到关注,因为经典的不确定数据聚类算法具有概率密度函数获取困难、实用性不强以及计算复杂等缺点,提出一种基于区间数的不确定数据流聚类算法UIDStream.算法用区间数来表示属性不确定性数据和基于区间数的距离计算方法,定义了不确定性数据之间的相似度,并利用传统k近邻聚类的思想,提出基于区间数的2k近邻微簇和最优2k近邻微簇的概念,通过最优2k近邻微簇的融合,实现不确定数据流的聚类.实验结果表明:改进后的算法具有良好的聚类效果,提高了不确定数据流聚类的聚类质量和速率.
|
本文献已被 CNKI 等数据库收录! |
|