首页 | 本学科首页   官方微博 | 高级检索  
     

一种自顶向下挖掘长频繁项的有效方法
引用本文:王晓峰,王天然,赵越.一种自顶向下挖掘长频繁项的有效方法[J].计算机研究与发展,2004,41(1):148-155.
作者姓名:王晓峰  王天然  赵越
作者单位:1. 中国科学院沈阳自动化研究所,沈阳,110003;沈阳化工学院计算机科学与技术学院,沈阳,110142
2. 中国科学院沈阳自动化研究所,沈阳,110003
3. 沈阳化工学院计算机科学与技术学院,沈阳,110142
基金项目:国家“八六三”高技术研究发展计划基金 ( 2 0 0 1AA413 410 ),辽宁省自然科学基金 ( 9910 2 0 0 2 0 5 )
摘    要:Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问题 采用了一种新的自上而下挖掘方法 ,提出了事务项目关联信息表、关键项目、项目约简、投影数据库等新概念 ,利用投影、约简等方法在候选项集生成过程中及时修剪重复分支 ,使算法的实际效率大为提高 ,较好地解决了长频繁项的挖掘问题 通过计算机实验和算法分析证明了这种挖掘方法的有效性和完备性 新算法的计算复杂度与项目集平均约简项长度有关 ,估计为 0 5×M3 N×O(2 S×N′2 ) 其中 ,S为系统在用户给定最小支持度条件下的平均约简项长度 ,N′是数据库所对应关系的元组数 ,N为记录数 ,M为项目集平均长度 对于长频繁项来说S很小 ,计算复杂度接近多项式时间

关 键 词:自顶向下  数据挖掘  关联规则  项目约简  频繁项

An Effective Top-Down Data Mining Method for Long Frequents
WANG Xiao-Feng ,WANG Tian-Ran ,and ZHAO Yue.An Effective Top-Down Data Mining Method for Long Frequents[J].Journal of Computer Research and Development,2004,41(1):148-155.
Authors:WANG Xiao-Feng    WANG Tian-Ran  and ZHAO Yue
Affiliation:WANG Xiao-Feng 1,2,WANG Tian-Ran 1,and ZHAO Yue 2 1
Abstract:
Keywords:top-down  data mining  associate rules  reduction items  frequent item
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号