排序方式: 共有109条查询结果,搜索用时 15 毫秒
1.
针对基于FP-树挖掘最大频繁项集的算法需要大量的递归调用导致挖掘效率降低的问题,本文提出一种减枝策略并结合FP-树的结构.依据构造Patricia-树的基本原理提出一种PFP-树,将FP-树中满足一定条件的结点进行合并来保存事务数据库,对事务数据库进行进一步压缩以达到降低内存开销和递归调用次数的目的.实验表明,当最小支持度较小时,在执行效率尤其在内存开销方面都有一定的改善. 相似文献
2.
为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算法运用递增构建候选项集模式树的策略缩小搜索空间,运用FP-tree的部分遍历操作简化搜索过程.在多个标准测试数据集上的实验结果表明,该算法的执行时间比同类算法减少了一个数量级,且占用较少的内存空间,因此该算法对于提高频繁项集和频繁闭项集的挖掘效率具有明显的效果. 相似文献
3.
4.
针对配电网运行时经常发生故障的情况,如何快速高效地寻找出配电网中的薄弱点成为了当下配电网安全运行的一大难题。文中采用频繁模式网络(FP-network)模型,建立事务-项目的关联矩阵,并且将所需要进行关联规则挖掘的数据储存在关联矩阵中,从而进行关联规则的数据挖掘。通过算例分析证实了FP-network关联规则挖掘算法可用于配电网薄弱点分析中,并通过配电网实际运行情况验证了该算法的可行性。该算法对配电网数据库中的故障数据仅仅需要进行一次扫描,从而提高了配电网故障数据关联规则挖掘的效率,更有利于配电网实时更新数据库,为分析检测配电网运行中的薄弱点提供了技术支持。 相似文献
5.
为了提升分布式能源系统数据挖掘精度与效率,保证分布式能源系统安全稳定运行,提出基于多维关联规则的分布式能源系统数据挖掘方法。离散化处理分布式能源系统中的所有数据,将数据转换为满足挖掘需求的数字化形式,明确数据支持度和隶属度值,建立与之对应的相关表,统计操作、运行和执行维度组合后总的支持度和隶属度值,通过分析每个维度的子维度得到正常和异常状态下两种数据。在Apriori算法基础上构建FP-树,不断生成频繁项集,直至不再产生新的项集时停止挖掘,采用剪枝处理去除部分冗余结点,保留下来的即为最终的数据挖掘结果。实验结果表明,所提方法能够精准挖掘出异常数据类型,且挖掘效率高,实际应用效果更好。 相似文献
6.
提出了对绩效管理关键绩效指标(KPI)的确定中挖掘最大频繁集的一种方法。该方法采用了位图数据格式;根据绩效管理中数据的特点,由用户的需求导出FP-tree。通过分析Apriori方法和FP-growth方法的优缺点,结合各种有效剪枝技术,对传统挖掘算法进行了改进,加速了FP-tree上的最大频繁集的生成,以适应绩效管理的应用环境。最后给出了实例以显示处理过程及效率。 相似文献
7.
8.
9.
目前,基于FP-树的最大频繁项集挖掘算法存在的一个问题是FP-树的规模过大,遍历树需耗费大量的运行时间,并且挖掘出来的很多频繁项集是用户不感兴趣的,过多的无用频繁 模式影响了挖掘的效率。本文提出一种排序紧缩非冗余的STFP-树,以及基于STFP-树的最大目标频繁项集挖掘算法STFP-MAX。该算法在满足用户需求的基础上有效地缩小了FP--树的规模,又加快了搜索的速度,从而提高了挖掘的效率。 相似文献
10.
提出了项集长度受限且生成项集对应事务信息的最大频繁项集挖掘问题,定义为L-MAX频繁项集挖掘,并重点研究了项集长度约束特征和事务集信息的存储与生成策略.首先研究了L-MAX频繁项集的性质,然后扩展FP-tree提出了ExFP-tree结构并给出ExFP-tree生成算法.ExFP-tree利用FP-tree共享前缀路径的性质通过共享子孙节点事务信息策略实现大量事务信息的压缩存储;最后基于FP-MAX算法,提出基于ExFP-tree的L-MAX频繁项集挖掘算法,核心思想是先根据L-MAX频繁项集长度约束性质进行前瞻剪枝再进行最大频繁项集挖掘,并通过回溯策略直接定位生成对应事务集. 相似文献