基于BTA算法的数据流频繁项集挖掘 |
| |
作者姓名: | 文凯 耿小海 许萌萌 |
| |
作者单位: | 重庆邮电大学通信与信息工程学院,重庆400065;重庆邮电大学通信新技术应用研究中心,重庆400065;重庆信科设计有限公司,重庆401121;重庆邮电大学通信与信息工程学院,重庆400065;重庆邮电大学通信新技术应用研究中心,重庆400065 |
| |
摘 要: | 针对传统数据流频繁项集挖掘算法在挖掘频繁k-项集时会有候选项集产生,在有新的数据流到来时的数据更新以及频繁项集支持度更新的效率不高,造成挖掘的时间和空间效率不高等一系列问题,提出一种高效的数据流频繁项集挖掘算法BTA (bit table with and algorithm)算法。将数据高效压缩进位表中,对窗口更新采用取余覆盖;在频繁k-项集的挖掘采用与操作避免候选项集产生;在支持度更新采用加减运算得到数据更新后的支持度。实验结果表明,该算法在时间和空间效率上均有良好效果。
|
关 键 词: | 数据流 频繁项集 压缩位表 与操作 数据挖掘 |
本文献已被 万方数据 等数据库收录! |
|