首页 | 本学科首页   官方微博 | 高级检索  
     

CBC-DS:基于频繁闭模式的数据流分类算法
引用本文:敖富江, 王 涛, 刘宝宏, 黄柯棣. CBC-DS: 基于频繁闭模式的数据流分类算法[J]. 计算机研究与发展, 2009, 46(5): 779-786.
作者姓名:敖富江  王涛  刘宝宏  黄柯棣
作者单位:国防科学技术大学机电工程与自动化学院,长沙,410073;国防科学技术大学计算机学院,长沙,410073
摘    要:基于关联规则的分类算法通常根据频繁模式生成类关联规则,但频繁模式挖掘易遭受组合爆炸问题,影响算法效率.并且数据流的出现也对分类算法提出了新的挑战.相对于频繁模式,频繁闭模式的数目较少,挖掘频繁闭模式的算法通常具有较高的效率.为此,提出了一种高效的基于频繁闭模式的数据流分类算法—CBC-DS.主要贡献在于:1)提出了一种基于逆文法顺序FP-Tree的频繁闭项集单遍挖掘过程,用于挖掘类关联规则,该过程采用了一种混合项顺序搜索策略以满足数据流挖掘的单遍性需求,并采用位图技术提高效率;2)提出了“自支持度”概念,用于筛选规则以提高算法分类精度.实验表明,位图技术能够提高算法速度2倍以上,利用自支持度能够提高算法平均精度0.5%左右;最终CBC-DS算法的平均分类精度比经典算法CMAR高1%左右,并且CBC-DS算法的规则挖掘速度远快于CMAR算法.

关 键 词:数据流  分类  关联规则  频繁闭模式  自支持度

CBC-DS:A Classification Algorithm Based on Closed Frequent Patterns for Mining Data Streams
Ao Fujiang, Wang Tao, Liu Baohong, Huang Kedi. CBC-DS: A Classification Algorithm Based on Closed Frequent Patterns for Mining Data Streams[J]. Journal of Computer Research and Development, 2009, 46(5): 779-786.
Authors:Ao Fujiang  Wang Tao  Liu Baohong  Huang Kedi
Affiliation:1(College of Mechanical Engineering and Automation, National University of Defense Technology, Changsha 410073) 2(College of Computer, National University of Defense Technology, Changsha 410073)
Abstract:The classification algorithms based on association rules generally generate classification association rules by frequent patterns.As mining frequent patterns often suffer from the problem of combinatorial explosion,the efficiency of the algorithms is low.Moreover,the emergence of data streams has posed new challenges for classification algorithms.In contrast to frequent patterns,the number of closed frequent patterns is less,so that the efficiency of algorithms for mining closed frequent patterns is higher....
Keywords:data stream  classification  association rule  closed frequent pattern  self-support  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机研究与发展》浏览原始摘要信息
点击此处可从《计算机研究与发展》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号