首页 | 本学科首页   官方微博 | 高级检索  
     

基于生成子的频繁项集聚类算法
引用本文:李晋宏,杨炳儒,宋威,侯伟.基于生成子的频繁项集聚类算法[J].计算机工程与应用,2008,44(35):5-8.
作者姓名:李晋宏  杨炳儒  宋威  侯伟
作者单位:1.北京科技大学 信息工程学院,北京 100083 2.北方工业大学 信息工程学院,北京 100144
基金项目:国家自然科学基金 , 北京市属市管高等学校人才强教计划项目  
摘    要:如何有效地约简频繁项集的数量是目前数据挖掘研究的热点。对频繁项集进行聚类是该问题的解决方法之一。由于生成子是全体频繁项集的无损精简表示,故对生成子进行聚类与对全体频繁项集进行聚类具有相同的效果。提出了一种基于生成子的频繁项集聚类算法。首先,利用最小描述长度原理,讨论了选择生成子进行聚类的合理性;其次,给出了生成子的剪枝策略及挖掘算法;最后,在一种新的项集相似性的度量标准的基础上,给生成子的聚类算法。实验结果表明,该方法可有效地减少项集的数量,并具有较高的挖掘效率。

关 键 词:数据挖掘  生成子  聚类  
收稿时间:2008-9-12
修稿时间:2008-10-6  

Algorithm for clustering frequent itemsets based on generators
LI Jin-hong,YANG Bing-ru,SONG Wei,HOU Wei.Algorithm for clustering frequent itemsets based on generators[J].Computer Engineering and Applications,2008,44(35):5-8.
Authors:LI Jin-hong  YANG Bing-ru  SONG Wei  HOU Wei
Affiliation:1.School of Information Engineering,University of Science and Technology Beijing,Beijing 100083,China 2.College of Information Engineering,North China University of Technology,Beijing 100144,China
Abstract:
Keywords:data mining  generator  clustering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号