基于概率衰减窗口模型的不确定数据流频繁模式挖掘 |
| |
引用本文: | 廖国琼, 吴凌琴, 万常选. 基于概率衰减窗口模型的不确定数据流频繁模式挖掘[J]. 计算机研究与发展, 2012, 49(5): 1105-1115. |
| |
作者姓名: | 廖国琼 吴凌琴 万常选 |
| |
作者单位: | 1(江西财经大学信息管理学院 南昌 330032) 2(江西省高校数据与知识工程重点实验室 南昌 330032) 3(江西省赣抚平原水利工程管理局 南昌 330201) (liaoguoqiong@163.com) |
| |
基金项目: | 国家自然科学基金项目,江西省自然科学基金项目,江西省教育厅科技重点基金项目,江西省教育厅青年科学基金项目,江西省优势科技创新团队建设计划基金项目 |
| |
摘 要: | 考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能.
|
关 键 词: | 不确定数据 数据流 概率频繁模式 频繁模式挖掘 数据挖掘 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机研究与发展》浏览原始摘要信息 |
|
点击此处可从《计算机研究与发展》下载免费的PDF全文 |
|