首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。  相似文献   

2.
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。  相似文献   

3.
发现频繁项集是关联规则挖掘中最基本、最重要的问题.提出了一种基于二进制表示的频繁项集挖掘算法,并利用二进制的性质快速产生候选项集并计算其支持度.算法总体性能在一定程度上得到了提高.  相似文献   

4.
二进制挖掘算法在空间数据挖掘中的应用   总被引:1,自引:0,他引:1  
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题.  相似文献   

5.
Apriori算法中频繁项集挖掘实现研究   总被引:3,自引:0,他引:3  
在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购物篮数据中的频繁项集进行了验证,结果是一致的。算法的有效性也为进一步挖掘关联规则中的强规则提供了基础。  相似文献   

6.
本文提出一种基于ESEquivPS(扩展支持度相等性剪枝策略)的封闭频繁项集挖掘算法ECFIMA。该算法采用深度优先和广度优先相结合的策略访问搜索空间,使用垂直位图向量格式存储表示项集和事务数据库,同时利用基本剪枝策略、相等性剪枝策略、扩展支持度相等性剪枝策略1和扩展支持度相等性剪枝策略2进行候选空间剪枝,并采用多种不同特性的测试数据集进行实验。实验结果表明,ECFIMA算法是一种高效的封闭频繁项集挖掘算法,在多种测试数据集上性能都优于CHARM算法,尤其是在拥有大量长的封闭频繁项集的测试数据集上,效率比CHARM算法提高约2~3倍。  相似文献   

7.
Apriori算法中频繁项集挖掘实现研究   总被引:4,自引:0,他引:4  
在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购物篮数据中的频繁项集进行了验证,结果是一致的。算法的有效性也为进一步挖掘关联规则中的强规则提供了基础。  相似文献   

8.
基于二进制信息粒的数据挖掘算法研究   总被引:2,自引:0,他引:2  
本文利用二进制数来表示基于粗糙集思想的信息粒的概念,定义了基于上述信息粒的一些粒计算的基本定义.并且提出了两个典型的基于粒计算的数据挖掘算法,即基于二进制信息粒的属性重要度算法和决策树算法.最后实验和分析验证了研究的有效性.  相似文献   

9.
一直以来,关联规则挖掘算法主要基于支持度-可信度构架,但这样的算法有一个固有的缺陷,不能对非频繁项进行研究,而在许多实际应用中,如相似Web文档的识别。灾害预防,往往需要对高度关联的项集进行分析,即使它不是频繁出现的,放弃支持度,只使用可信度的关联规则挖掘算法将有利于这一问题的解决,这是一个新的研究方向。在对传统的关联规则挖掘算法进行了简单介绍后,主要介绍了基于可信度构架的关联规则挖掘算法,并对它们进行了分析与评价。  相似文献   

10.
多段支持度数据挖掘算法研究   总被引:17,自引:0,他引:17  
在基于相联规则的数据挖掘算法中,Apriori等算法最为著名。它分为两个主要步骤:(1)通过多趟扫描数据库求解出频繁项集;(2)利用频繁项集生成规则。随后的许多算法都沿用Apriori中“频繁项集的子集必为频繁项集”的思想,在频繁项集Lk-1上进行JOIN运算构成潜在k项集Ck。由于数据库和Ck的规模较大,需要相当大的计算量才能生成频繁项集。AprioriTid算法给每个事务增加了一个唯一标识Tid,其特点是只扫描一趟数据库,其余趟扫描(如第k趟扫描)均在相应的数据集Ck^-上进行。由于数据规模改变不大,各算法的效率差别并不明显。该文提出分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量。由于有了项集的多段支持度,可以推测出该项集能否包含在更大规模的频率项集中,采用这种算法既提高了在扫描数据库中的信息获取度,又能及时剔除超集不是频繁项集的项集,进一步缩减了潜在项集的规模,在数据集扫描过程中,按文中定理1的思想调整数据集,达到提高频繁项集生成效率的目的。  相似文献   

11.
在对数据挖掘技术的概念、挖掘过程和常用方法等知识进行简单介绍的基础上.就如何在日常的教学中应用数据挖掘,从中得到教学上需要的信息等内容进行了探讨.从而为我们的教育事业添砖加瓦:  相似文献   

12.
数据挖掘技术在教学中的应用   总被引:1,自引:0,他引:1  
在对数据挖掘技术的概念、挖掘过程和常用方法等知识进行简单介绍的基础上,就如何在日常的教学中应用数据挖掘,从中得到教学上需要的信息等内容进行了探讨,从而为我们的教育事业添砖加瓦。  相似文献   

13.
本文在论述数据仓库、数据挖掘和决策支持系统的基本概念决策支持系统的应用模式,针对2种典型的企业应用提出了解决方案.  相似文献   

14.
数据挖掘被称为数据库中的知识发现,是一个跨学科的研究领域。关联规则分析是数据挖掘中一个重要的课题,用于发现存在于数据库中的项或属性间的关联联系,这些联系是事先未知且隐藏的。关联规则的研究主要集中在生成频繁项集的挖掘算法,通过对几种主要关联规则的算法分析,利用Apriori算法研究再生资源系统中关联规则的确定,从而实现物资的二次销售。  相似文献   

15.
运用高校学生成绩、学籍等相关数据,创建高校学生成绩分析的数据仓库,运用ID3算法实现基于学生成绩等级的决策树挖掘模型的构建,由决策树提取分类规则,并利用Analysis Services工具进行挖掘验证.  相似文献   

16.
数据挖掘技术在装备保障决策支持系统中的应用   总被引:2,自引:0,他引:2  
介绍了数据挖掘的基本概念,分析了装备保障决策支持系统的组成,并结合装备保障的特点对数据挖掘在装备保障决策支持系统中的应用进行了阐明。  相似文献   

17.
分布式系统下挖掘关联规则的两种方案   总被引:9,自引:0,他引:9  
对关联规则的分布式挖掘问题进行了探讨,给出了两种实现方案。一是采用局部-局部的通信模式,各个站点的通信负载比较均衡;二是采用局部-全局的通信模式,减少了各局部站点的通信负荷,实现了各局部站点的完全异步,但对全局站点的性能要求较高。  相似文献   

18.
数据挖掘技术在教学评价中的应用   总被引:23,自引:0,他引:23  
数据挖掘技术是在海量数据中提取有用信息的有效手段,它被广泛应用于经济效益巨大的金融、商业等领域,而在教学评价中应用较少,这使得一些对教学效果有较大影响的因素往往被忽视。该文介绍了把数据挖掘技术引入网上教学评价中的有益尝试。  相似文献   

19.
数据库中关联规则的并行挖掘算法   总被引:2,自引:1,他引:1  
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号