首页 | 本学科首页   官方微博 | 高级检索  
     

不确定性数据上频繁项集挖掘的预处理方法
引用本文:李海峰,章宁,柴艳妹.不确定性数据上频繁项集挖掘的预处理方法[J].计算机科学,2012,39(7):161-164.
作者姓名:李海峰  章宁  柴艳妹
作者单位:中央财经大学信息学院 北京100081
基金项目:国家自然科学基金项目,中央财经大学科研创新团队支持计划资助
摘    要:传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息。通过研究频繁模式增长树的算法原理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth。利用主成分分析的方法进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝。在理论研究基础上,通过实验对数据集进行了验证。结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用。

关 键 词:不确定性数据  频繁项集  主成分分析  模糊关联

Uncertain Data Preconditioning Method in Frequent Itemset Mining
LI Hai-feng , ZHANG Ning , CHAI Yan-mei.Uncertain Data Preconditioning Method in Frequent Itemset Mining[J].Computer Science,2012,39(7):161-164.
Authors:LI Hai-feng  ZHANG Ning  CHAI Yan-mei
Affiliation:(School of Information,Central University of Finance and Economics,Beijing 100081,China)
Abstract:Traditional studies of frectuent itemset mining cannot obtain information from uncertain data efficiently. We studied the frequent pattern tree and proposed an effective uncertain data preconditioning method, the PCAFP-Growth, which can reduce the itemset dimensions with principal component analysis method,and prune data with fuzzy associa- lion analysis. Our experimental results over real world datasets show that our method is effective and efficient
Keywords:Uncertain data  Frequent itemset  Principle component analysis  Fuzzy association
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号