数据挖掘网格中决策树并行算法设计及性能分析 |
| |
引用本文: | 陈平,乔秀全,刘臻,田小萍.数据挖掘网格中决策树并行算法设计及性能分析[J].北京邮电大学学报,2009,32(21):49-52. |
| |
作者姓名: | 陈平 乔秀全 刘臻 田小萍 |
| |
作者单位: | 1北京师范大学 信息网络中心; 2北京邮电大学 网络与交换技术国家重点实验室 |
| |
摘 要: | 提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘. 采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题. 并给出了指导该并行算法高效计算的方法. 数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.
|
关 键 词: | 数据挖掘 网格计算 决策树 并行性能 |
收稿时间: | 2009-04-13 |
|
| 点击此处可从《北京邮电大学学报》浏览原始摘要信息 |
|
点击此处可从《北京邮电大学学报》下载全文 |
|