在单向FP-tree上挖掘频繁闭项集 |
| |
作者姓名: | 王现君 宋晶晶 姜保庆 |
| |
作者单位: | 河南大学,数据与知识工程研究所,河南,开封,475004;清远职业技术学院,信息科技学院,广东,清远,511510 |
| |
基金项目: | 国家自然科学基金(the National Natural Science Foundation of China under Grant No.60474022),河南省高校杰出科研人才创新工程项目(No.2007KYCX018) |
| |
摘 要: | 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。
|
关 键 词: | 数据挖掘 频繁项集 频繁闭项集 单向FP-tree 被约束子树 |
文章编号: | 1002-8331(2008)10-0150-04 |
收稿时间: | 2007-07-13 |
修稿时间: | 2007-07-13 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|