一种改进的CLIQUE算法及其并行化实现 |
| |
引用本文: | 林鹏,?覮,陈曦,龙鹏飞,傅明.一种改进的CLIQUE算法及其并行化实现[J].计算技术与自动化,2018(4):49-54. |
| |
作者姓名: | 林鹏 ?覮 陈曦 龙鹏飞 傅明 |
| |
作者单位: | (1.长沙理工大学 综合交通运输大数据智能处理湖南省重点实验室, 湖南 长沙 410114;
2. 长沙理工大学 计算机与通信工程学院,湖南 长沙 410114) |
| |
摘 要: | CLIQUE算法是一种高效的聚类算法,但其聚类结果存在锯齿边界的问题。而且随着数据规模和维度的增加,算法的效率受到极大影响。针对这些问题,提出一种改进的CLIQUE算法,算法首先使用边界修正方法和滑动网格方法,对稠密区域的边界和稀疏区域进行扫描,寻回被剪枝的稠密网格,提升网格划分的质量;然后实现了改进算法在MapReduce下的分布式并行化,并通过实验验证了算法的性能。实验结果表明,改进后的并行算法的聚类准确率提高了17%~26%,同时有效地减少了处理海量数据的运行时间,具有良好的扩展性。
|
关 键 词: | 边界修正方法 滑动网格方法 CLIQUE算法 MapReduce |
Improved CLIQUE Algorithm and its Parallelization |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《计算技术与自动化》浏览原始摘要信息 |
|
点击此处可从《计算技术与自动化》下载全文 |
|