共查询到19条相似文献,搜索用时 62 毫秒
1.
程杰 《数字社区&智能家居》2009,5(5):3486-3488
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。 相似文献
2.
程杰 《数字社区&智能家居》2009,(13)
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。 相似文献
3.
发现频繁项集是关联规则挖掘中最基本、最重要的问题.提出了一种基于二进制表示的频繁项集挖掘算法,并利用二进制的性质快速产生候选项集并计算其支持度.算法总体性能在一定程度上得到了提高. 相似文献
4.
二进制挖掘算法在空间数据挖掘中的应用 总被引:1,自引:0,他引:1
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题. 相似文献
5.
Apriori算法中频繁项集挖掘实现研究 总被引:3,自引:0,他引:3
在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购物篮数据中的频繁项集进行了验证,结果是一致的。算法的有效性也为进一步挖掘关联规则中的强规则提供了基础。 相似文献
6.
本文提出一种基于ESEquivPS(扩展支持度相等性剪枝策略)的封闭频繁项集挖掘算法ECFIMA。该算法采用深度优先和广度优先相结合的策略访问搜索空间,使用垂直位图向量格式存储表示项集和事务数据库,同时利用基本剪枝策略、相等性剪枝策略、扩展支持度相等性剪枝策略1和扩展支持度相等性剪枝策略2进行候选空间剪枝,并采用多种不同特性的测试数据集进行实验。实验结果表明,ECFIMA算法是一种高效的封闭频繁项集挖掘算法,在多种测试数据集上性能都优于CHARM算法,尤其是在拥有大量长的封闭频繁项集的测试数据集上,效率比CHARM算法提高约2~3倍。 相似文献
7.
Apriori算法中频繁项集挖掘实现研究 总被引:4,自引:0,他引:4
在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购物篮数据中的频繁项集进行了验证,结果是一致的。算法的有效性也为进一步挖掘关联规则中的强规则提供了基础。 相似文献
8.
9.
10.
多段支持度数据挖掘算法研究 总被引:17,自引:0,他引:17
在基于相联规则的数据挖掘算法中,Apriori等算法最为著名。它分为两个主要步骤:(1)通过多趟扫描数据库求解出频繁项集;(2)利用频繁项集生成规则。随后的许多算法都沿用Apriori中“频繁项集的子集必为频繁项集”的思想,在频繁项集Lk-1上进行JOIN运算构成潜在k项集Ck。由于数据库和Ck的规模较大,需要相当大的计算量才能生成频繁项集。AprioriTid算法给每个事务增加了一个唯一标识Tid,其特点是只扫描一趟数据库,其余趟扫描(如第k趟扫描)均在相应的数据集Ck^-上进行。由于数据规模改变不大,各算法的效率差别并不明显。该文提出分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量。由于有了项集的多段支持度,可以推测出该项集能否包含在更大规模的频率项集中,采用这种算法既提高了在扫描数据库中的信息获取度,又能及时剔除超集不是频繁项集的项集,进一步缩减了潜在项集的规模,在数据集扫描过程中,按文中定理1的思想调整数据集,达到提高频繁项集生成效率的目的。 相似文献
11.
任小娟 《数字社区&智能家居》2006,(1):211-212
在对数据挖掘技术的概念、挖掘过程和常用方法等知识进行简单介绍的基础上.就如何在日常的教学中应用数据挖掘,从中得到教学上需要的信息等内容进行了探讨.从而为我们的教育事业添砖加瓦: 相似文献
12.
数据挖掘技术在教学中的应用 总被引:1,自引:0,他引:1
任小娟 《数字社区&智能家居》2006,(2)
在对数据挖掘技术的概念、挖掘过程和常用方法等知识进行简单介绍的基础上,就如何在日常的教学中应用数据挖掘,从中得到教学上需要的信息等内容进行了探讨,从而为我们的教育事业添砖加瓦。 相似文献
13.
14.
15.
运用高校学生成绩、学籍等相关数据,创建高校学生成绩分析的数据仓库,运用ID3算法实现基于学生成绩等级的决策树挖掘模型的构建,由决策树提取分类规则,并利用Analysis Services工具进行挖掘验证. 相似文献
16.
数据挖掘技术在装备保障决策支持系统中的应用 总被引:2,自引:0,他引:2
介绍了数据挖掘的基本概念,分析了装备保障决策支持系统的组成,并结合装备保障的特点对数据挖掘在装备保障决策支持系统中的应用进行了阐明。 相似文献
17.
18.
数据挖掘技术在教学评价中的应用 总被引:23,自引:0,他引:23
数据挖掘技术是在海量数据中提取有用信息的有效手段,它被广泛应用于经济效益巨大的金融、商业等领域,而在教学评价中应用较少,这使得一些对教学效果有较大影响的因素往往被忽视。该文介绍了把数据挖掘技术引入网上教学评价中的有益尝试。 相似文献
19.
数据库中关联规则的并行挖掘算法 总被引:2,自引:1,他引:1
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。 相似文献