首页 | 本学科首页   官方微博 | 高级检索  
     

基于预聚类技术的并行序贯模式挖掘算法
引用本文:金沈杰,吴绍春,吴耿锋,严胜祥.基于预聚类技术的并行序贯模式挖掘算法[J].计算机工程与科学,2004,26(10):66-68.
作者姓名:金沈杰  吴绍春  吴耿锋  严胜祥
作者单位:上海大学计算机工程与科学学院,上海,200072;上海大学计算机工程与科学学院,上海,200072;上海大学计算机工程与科学学院,上海,200072;上海大学计算机工程与科学学院,上海,200072
基金项目:上海市科委“基于高性能计算的数据挖掘和知识发现”项目(01JC14002),上海市教委“第四期重点学科”项目(205153)
摘    要:本文讨论了在并行序贯模式数据挖掘方面采用“预聚类并行序贯模式挖掘”的策略,对数据序列聚类后按不同的类分布到不同的并行节点上,以减少甚至消除不必要的通讯开销,以便能够提高并行序贯模式挖掘在集群式高性能计算机上的执行效率。

关 键 词:数据挖掘  并行计算  序贯模式  聚类  数据分布
文章编号:1007-130X(2004)10-0066-03

Pre-Clustered Sequential Pattern Mining
JIN Shen-jie,WU Shao-chun,WU Geng-feng,YAN Sheng-xiang.Pre-Clustered Sequential Pattern Mining[J].Computer Engineering & Science,2004,26(10):66-68.
Authors:JIN Shen-jie  WU Shao-chun  WU Geng-feng  YAN Sheng-xiang
Abstract:In this article, we present the Pre-Clustered Sequential Pattern Mining Algorithm in the parallel sequential pattern mining field. The method clusters the data sequences according to different classes and distribute the them into different parallel computing nodes. Thus it greatly reduces the unnecessary communications overhead and improves the execution efficiency of parallel sequential pattern mining on clustered high-performance computers.
Keywords:data mining  parallel computing  sequential pattern  clustering  data distribution
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号