压缩UF-tree挖掘不确定数据频繁项 |
| |
作者姓名: | 陈超泉 黄佳欢 江云辉 |
| |
作者单位: | 桂林理工大学 信息科学与工程学院, 广西 桂林 541004 |
| |
基金项目: | 国家科技支撑计划资助项目(2008BAK50B02-02, 2011BAD32B02) |
| |
摘 要: | 针对UF-growth算法构造大量树节点和分支的局限性, 且不断计算候选数据项支持度的不足, 提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时, 将该数据项合并到分支中; 否则, 从该分支节点创建新的分支, 叶节点保存当前事务编号。构建单项数据项的概率向量, 搜索树分支产生候选项, 通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析, 压缩UF-tree算法可行且更高效。
|
关 键 词: | 数据挖掘 不确定数据 事务 分支 概率向量 频繁项 |
|
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|