一种基于代表点的分布式数据流聚类算法 |
| |
作者姓名: | 高兵 张健沛 杨静 |
| |
作者单位: | 1. 哈尔滨工程大学计算机科学与技术学院,哈尔滨150001;大连东软信息学院计算机系,辽宁大连116023 2. 哈尔滨工程大学计算机科学与技术学院,哈尔滨,150001 |
| |
基金项目: | 国家自然科学基金资助项目(61073043); 黑龙江省自然科学基金资助项目(F201023) |
| |
摘 要: | 为发现分布式数据流下不同形状的聚簇,提出了一种基于代表点的聚类算法。算法首先在代表点定义的基础上,提出环点的概念以及迭代查找密度相连环点的算法,在此基础上生成远程站点的局部模型;然后在协调站点设计合并局部模型,生成全局聚簇的算法。通过真实数据集与仿真数据集的实验表明,算法使用代表点能够发现不同形状的聚簇并显著降低数据传输量,同时通过测试—更新局部模型算法避免了频繁发送数据。
|
关 键 词: | 分布式数据流 数据挖掘 聚类 聚类演化 代表点 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|