数据划分优化的并行k-means算法 |
| |
作者姓名: | 尹建君 王乐 |
| |
作者单位: | 1.成都医学院 人文信息管理学院,成都 610083 2.国防科技大学 计算机学院,长沙 410073 |
| |
摘 要: | 针对大规模文本聚类中对聚类算法执行效率的要求,提出了一个内容相关的纵向数据划分策略FTDV,并基于该策略提出了数据划分优化的并行DVP k-means算法,提高了常规并行k-means算法的并行化程度,达到了优化算法执行效率的目的。在实验中,与常规并行k-means算法和基于关键方向分解的PDDP k-means算法进行比较,DVP k-means具有更好的并行性和对数据规模的适应性,且可以生成更高质量的聚簇。
|
关 键 词: | 数据划分 并行聚类算法 频繁词集 k-means算法 |
收稿时间: | 2008-11-18 |
修稿时间: | 2009-2-23
|
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|