期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵栋卢炎生《计算机工程与科学》2005,27(10):53-54

在大的数据集合中,开采其中的频繁项目集集合是数据挖掘中极具挑战的重要任务。已经有很多高效的算法被总结了出来。本文提出了一种思想,即开采频繁项目集集合的一个子集,我们称之为频繁无析取规则集集合,而并非开采完全的频繁项目集集合。我们证明能借助它不读取数据库而还原出频繁项目集集合的全集和它们的支持度。本文还提提出了一个开采无析取规则集集合的算法HOPE-Ⅱ,实验结果显示了其高效性。我们将它与另一种称为频繁封闭集的精简集进行对比,几乎所有的实验结果都显示使用无析取规则集集合比使用封闭集集合来开采频繁项目集集合更有效。相似文献

2.

一种基于无或言规则集的改进的关联规则挖掘算法

卢炎生王莉赵栋《计算机工程》2005,31(5):99-101

提出了一个基于无或言规则集的改进的关联规则算法——IHPD,无或言规则集（disjunction-frce sets)是一种精简集表示。这一算法总结了HLinEx,IHP和DHP算法的优点,极大地改善了算法性能,并且使算法的使用不仅仅局限于长类型的频繁项目集挖掘,实验结果表明IHPD算法在性能上比HLinEx更高效。相似文献

3.

一种频繁核心项集的快速挖掘算法

田卫东纪允《计算机工程》2014,(6):120-124

传统的频繁核心项集挖掘需多次生成和反复扫描数据库,导致生成效率低下。为此,提出一种快速生成频繁核心项集算法FMEP。该算法使用Rymon枚举树作为搜索空间,并采用分而治之的策略选择特定的路径进行剪枝。利用频繁核心项集特有的反单调性质,可以快速地判断某一个候选项集是否为频繁核心项集,而无需和所有直接子集的析取支持度进行比较。通过上述方法,可以达到快速挖掘的目的。实验结果证明,该算法能够在挖掘出所有的频繁核心项集精简表示元素的同时,降低消耗时间,与MEP算法相比,在密集型数据集上的时间可缩短2倍以上,在稀疏型数据集上时间至少缩短30%。相似文献

4.

一种新的最大频繁项目集挖掘算法 总被引：5，自引：0，他引：5

马丽生邓辉文齐逸《计算机应用》2006,26(11):2670-2673

最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种新的挖掘最大频繁项目集的算法,实验表明该算法在性能上优于已有的同类算法。相似文献

5.

一种快速挖掘频繁项目集算法

白石磊毛雪岷王儒敬熊范纶《模式识别与人工智能》2003,16(4)

发现频繁项目集是多种数据挖掘应用中的的,最新的研究主要围绕减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来提高效率.本文提出一种快速挖掘频繁项目集的算法FDFI(fast discoveryfrequentitemsets).该算法利用深度优先搜索的特点,结合频繁项目集的性质,有效地缩小了搜索空间,并采用独特的支持度计数策略,只需一次数据库扫描,就可计算所有项目集的支持度,大大减少了数据扫描量.最后作者对这一算法的性能进行了理论分析和实验验证. 相似文献

6.

一种基于F-矩阵的最大频繁项目集快速挖掘算法

杨萍《计算机工程与应用》2003,39(34):197-200

最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。相似文献

7.

一种基于FP-tree的最大频繁项目集挖掘算法 总被引：7，自引：0，他引：7

刘乃丽李玉忱马磊《计算机应用》2005,25(5):998-1000

挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文中改进了FP 树结构,提出了一种基于FP tree的快速挖掘最大频繁项目集的算法DMFIA 1,该算法不需要生成最大频繁候选项目集,比DMFIA算法挖掘最大频繁项目集的效率更高。改进的FP 树是单向的,每个结点只保留指向父结点的指针,这大约节省了三分之一的树空间。相似文献

8.

快速挖掘频繁项目集算法 总被引：2，自引：0，他引：2

马丽生《计算机工程与设计》2009,30(8)

频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种能够快速挖掘频繁项目集的算法,对频繁项目集挖掘的搜索空间以及数据表示进行了优化,缩小搜索空间和数据表示的规模,减少计算项目集支持数的时间,提高算法的执行效率,实验结果表明,该算法在性能上优于FP-Growth算法. 相似文献

9.

一个改进的关联规则的频繁项目集数据挖掘算法 总被引：1，自引：0，他引：1

吴振光《计算机科学》2007,34(9):145-147

在关联规则中的Apriori算法,具有天生的缺陷,运行效果很不理想。为了克服Apriori算法的缺点,本文提出了一个改进的算法：在产生频繁项目集组合时,只需扫描数据库一次,这样就可以有效率地降低I／O的存取时间,更快速地找出符合使用者需求的关联规则。仿真实验表明,该算法是有效的。相似文献

10.

一种快速发现最大频繁项目集的序列算法

何婧王丽珍邹力鹍张忠玉《计算机工程》2003,29(16):62-64,124

提出了一种快速发现最大频繁项目集的算法MFIA。该算法只需扫描一遍数据库,通过构造数据库事务的相应项目序列来发现最大频繁项目集。实验表明：MFIA算法性能稳定,可扩展性好,效率高。相似文献

11.

基于幂集的关联规则挖掘算法研究 总被引：13，自引：2，他引：13

闫炜崔杜武付长龙《计算机工程与应用》2004,40(1):192-193,200

首次提出了利用幂集作为挖掘关联规则的工具,给出了基于幂集的关联规则挖掘算法。该算法有效解决了传统算法中需对数据库多次扫描的不足,实现了对数据库一次扫描就可挖掘出所有频繁集的功能。相似文献

12.

基于MapReduce的关联规则挖掘

陈凤娟《广东电脑与电讯》2014,(8):59-60

关联规则挖掘是数据挖掘的一项重要技术,它主要是通过频繁项集挖掘得到关联规则。基于云计算的MapReduce模型的数据挖掘算法可以提高挖掘的效果及性能。相似文献

13.

基于模糊等价类的频繁项集精简表示方法

田卫东许静文《计算机应用研究》2016,33(7)

频繁项集挖掘是数据挖掘应用中的关键问题,而巨大的频繁项集数目成为了现实应用中的阻碍。为了解决这一问题,本文提出了一种基于格结构的频繁项集精简模型,并证明了该方法产生支持度误差的范围。此外,在模型的基础上提出了一种模糊等价类精简表示算法FEC。实验结果表明,该方法能够保证在频繁项集数量大幅降低的同时,不会引入过大的支持度错误,与Index-Meta算法相比,产生的支持度错误较小,有较高的应用价值。相似文献

14.

改进的多数据流协同频繁项集挖掘算法

王鑫刘方爱《计算机应用》2016,36(7):1988-1992

针对已有的多数据流协同频繁项集挖掘算法存在内存占用率高以及发现频繁项集效率低的问题,提出了改进的多数据流协同频繁项集挖掘（MCMD-Stream）算法。首先,该算法利用单遍扫描数据库的字节序列滑动窗口挖掘算法发现数据流中的潜在频繁项集和频繁项集;其次,构建类似频繁模式树（FP-Tree）的压缩频繁模式树（CP-Tree）存储已发现的潜在频繁项集和频繁项集,同时更新CP-Tree树中每个节点生成的对数倾斜时间表中的频繁项计数;最后,通过汇总分析得出在多条数据流中多次出现的且有价值的频繁项集,即协同频繁项集。相比A-Stream和H-Stream算法,MCMD-Stream算法不仅能够提高多数据流中协同频繁项集挖掘的效率,并且还降低了内存空间的使用率。实验结果表明MCMD-Stream算法能够有效地应用于多数据流的协同频繁项集挖掘。相似文献

15.

一种改进的基于矩阵的频繁项集挖掘算法

张笑达徐立臻《微机发展》2010,(4):93-96

如何从海量数据信息中挖掘出有用的关联规则已经成为人们广泛关注的问题,而在关联规则挖掘中,首要的问题就是如何高效地挖掘出频繁项集。针对已有FIMM算法作出改进,提出了一种改进的基于矩阵的频繁项集挖掘算法N—FIMM,该算法在FIMM基础上去除大量冗余的非频繁项集的项集,减少计算可能频繁项集的工作量,同时缩小了矩阵规模,提高了空间效率。通过对矩阵操作,一次性地产生所有的频繁项集。试验结果表明,该算法对已有的基于矩阵的频繁项集挖掘算法有了很大的改进,提高了挖掘效率。相似文献

16.

基于属性分组的高效挖掘关联规则算法 总被引：6，自引：0，他引：6

杨凯张小平马垣《计算机工程与应用》2005,41(31):157-159

挖掘频繁项集在数据挖掘中有着重要的作用。目前,关于频繁项集的挖掘问题已经提出了一些算法,虽然实现了一次扫描数据库即可以发现所有的频繁项集,但是当属性数目很多时,算法的执行效率下降很快。论文首次提出了利用属性分组作为挖掘关联规则的工具,给出了基于属性分组的频繁项集挖掘算法,用矩阵来存储数据库属性间的信息并提取频繁项集,而且不产生候选项集。经实验验证该算法是快速有效的。相似文献

17.

在单向FP-tree上挖掘频繁闭项集 总被引：1，自引：0，他引：1

王现君宋晶晶姜保庆《计算机工程与应用》2008,44(10):150-153

频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。相似文献

18.

Identifying Approximate Itemsets of Interest in Large Databases 总被引：2，自引：0，他引：2

Chengqi Zhang Shichao Zhang Geoffrey I. Webb 《Applied Intelligence》2003,18(1):91-104

This paper presents a method for discovering approximate frequent itemsets of interest in large scale databases. This method uses the central limit theorem to increase efficiency, enabling us to reduce the sample size by about half compared to previous approximations. Further efficiency is gained by pruning from the search space uninteresting frequent itemsets. In addition to improving efficiency, this measure also reduces the number of itemsets that the user need consider. The model and algorithm have been implemented and evaluated using both synthetic and real-world databases. Our experimental results demonstrate the efficiency of the approach. 相似文献

19.

基于格的频繁数据项集发现算法

金远平陈才扣《计算机工程与科学》2000,22(6):1-4

求频繁数据项集是挖掘关联规则的主要步骤,许多算法需要多次扫描数据集。本文提出了一个基于格理论的频繁数据项集发现算法,该算法最多只需对数据集扫描3次,有效地降低了I／O开销。相似文献