首页 | 本学科首页   官方微博 | 高级检索  
     

基于卡方分析的关联模式剪枝方法研究
引用本文:徐勇,周森鑫,胡凌云.基于卡方分析的关联模式剪枝方法研究[J].计算机工程与设计,2006,27(15):2753-2755.
作者姓名:徐勇  周森鑫  胡凌云
作者单位:安徽财经大学,信息工程学院,安徽,蚌埠,233041
基金项目:国家供销合作总社资助项目;安徽财经大学校科研和教改项目
摘    要:关联模式挖掘研究是数据挖掘研究领域的重要分支之一,旨在发现项集之间存在的关联或相关关系。然而,传统的基于支持度一可信度框架的挖掘方法存在着一些不足:一是会产生过多的模式(包括频繁项集和规则);二是挖掘出来的规则有些是用户不感兴趣的,无用的,甚至是错误的;所以在挖掘过程中能有效地对无用模式进行剪枝是必要的。将卡方分析引入到模式的相关性度量中,利用卡方检验对项集之间、规则前件与后件之间的相关性进行度量是一种有效的剪枝方法。实验结果分析表明,在支持度度量的基础上引入卡方检验可以有效地对非相关模式进行剪枝,从而减小频繁项集和规则的规模。

关 键 词:数据挖掘  频集  关联模式  卡方分析  剪枝
文章编号:1000-7024(2006)15-2753-03
收稿时间:2005-06-02
修稿时间:2005-06-02

Research of pruning for association patterns based on Chi-squared analysis
XU Yong,ZHOU Sen-xin,HU Ling-yun.Research of pruning for association patterns based on Chi-squared analysis[J].Computer Engineering and Design,2006,27(15):2753-2755.
Authors:XU Yong  ZHOU Sen-xin  HU Ling-yun
Affiliation:School of Information Engineering, Anhui University of Finance and Economics, Bengbu 233041, China
Abstract:Association patterns mining is one of the important task of research on data mining, which main purpose is finding the correlations between the items. However, there exist some shortcomings while using the common approach based on support-confidence framework to capture association patterns. First, there are a great number of redundant association rules generated; second, some of patterns generated are unwanted, even are misleading. So it is necessary to prune such uninteresting patterns. Chi-squared test is introduced to prune the irrelevant items via calculating the Chi-squared value of items, The experimental shows that Chi-squared test is efficient and the searching space of the algorithm is reduced remarkably.
Keywords:data mining  frequent sets  association patterns  Chi-squared analysis  pruning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号