面向数据流的频繁项集挖掘研究 |
| |
作者姓名: | 孟彩霞 |
| |
作者单位: | 西安邮电学院 计算机科学系,西安 710061 |
| |
基金项目: | 国家自然科学基金,陕西省自然科学基金,西安市科技创新支撑—应用发展研究计划项目 |
| |
摘 要: | 针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁项集挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集。然后,利用Count Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率。
|
关 键 词: | 数据流 数据挖掘 数据流挖掘 频繁项集 |
收稿时间: | 2009-02-12 |
修稿时间: | 2010-2-5
|
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|