首页 | 本学科首页   官方微博 | 高级检索  
     

压缩UF-tree挖掘不确定数据频繁项
作者姓名:陈超泉  黄佳欢  江云辉
作者单位:桂林理工大学 信息科学与工程学院, 广西 桂林 541004
基金项目:国家科技支撑计划资助项目(2008BAK50B02-02, 2011BAD32B02)
摘    要:针对UF-growth算法构造大量树节点和分支的局限性, 且不断计算候选数据项支持度的不足, 提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时, 将该数据项合并到分支中; 否则, 从该分支节点创建新的分支, 叶节点保存当前事务编号。构建单项数据项的概率向量, 搜索树分支产生候选项, 通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析, 压缩UF-tree算法可行且更高效。

关 键 词:数据挖掘  不确定数据  事务  分支  概率向量  频繁项
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号