首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
论文首先对一种基于关联规则分类的算法做出了分析。然后对算法中的类关联规则的提取方法进行了改进,得到了一种新的基于关联规则分类的算法。并结合棉花病虫害数据运行的结果对两种算法的运行效率和实用性进行了比较。  相似文献   

2.
研究分析了现有关联规则分类算法,总结了一般关联规则分类存在的不足,提出了一个基于关联规则挖掘技术构造分类器的新方法。该方法解决了传统算法产生规则太多,分类模型难以理解的问题。  相似文献   

3.
由于现代网络数据量的急速增长,利用现有的算法生成关联规则时,冗余规则的数量远远大于实际有价值的规则,冗余规则不仅影响用户分析,而且使关联规则的利用率也大大降低。针对关联规则的冗余问题,提出了一种基于一阶谓词公式去除商务数据冗余关联规则的方法,利用一阶谓词公式来表示关联规则,通过等价公式进行转换,并利用算法和矩阵等价将谓词公式转换为邻接矩阵,然后利用冗余规则算法进行删除。实验原始数据为UCI数据集,并利用Weka生成关联规则。最后利用Matlab和Java实现冗余规则的去除。  相似文献   

4.
该文重点介绍了最新的一种关联规则后处理的方法,并且我们提出了这种方法的优化算法,能够有效去除关联规则集合中的无趣模式,并且为模式的可视化提供了良好的工具。相关实验表明该方法具有更好的模式后处理能力。  相似文献   

5.
针对知识库的建立需要耗费大量的时间和人力,同时相同或相似领域的知识库数量越来越多,提出利用现有规则知识库进行合并生成一个新的规则知识库,并对生成的新规则知识库进行知识冗余、环路和冲突的检测算法。首先,规则库利用有向超图来表示;其次,将有向超图利用其邻接矩阵来表示,那么规则库的合并可以转换成有向超图所对应的邻接矩阵的合并,并依据邻接矩阵求可达矩阵以及利用总可达矩阵来检测规则库中规则的冗余、环路和冲突。最后,算法的有效性通过实例加以验证。  相似文献   

6.
一种基于事务规则树的高效关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了基于事务规则树改进的关联规则快速挖掘算法--FG算法.该算法不需要查找频繁项集,可直接求出所有无冗余的关联规则;将FG算法与其他算法进行实验比较,结果表明,FG算法在效率上优于其他算法,是有效的、可行的关联规则挖掘算法.  相似文献   

7.
基于PC-树的关联规则挖掘方法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘的一种常用方法,特别是用在货篮分析中,而关联规则的经典算法Apriori及其改进算法的时间复杂度和空间复杂度都比较高,对于数据库更新、用户定义最小支持度等动态数据挖掘的成本太高。针对这种情况,提出了用PC-树寻找频繁项集的算法,实现高效的动态数据挖掘。  相似文献   

8.
关联规则挖掘向来是数据挖掘的一个重要领域,挖掘算法也层出不穷.本文在深入分析了FP树特性的基础上,改进了FP树构造过程,通过一次扫描事务数据库生成FP树.缩短了关联规则挖掘时间,提高了效率,实验验证了其有效性.  相似文献   

9.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

10.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

11.
Tree Structures for Mining Association Rules   总被引:1,自引:0,他引:1  
A well-known approach to Knowledge Discovery in Databases involves the identification of association rules linking database attributes. Extracting all possible association rules from a database, however, is a computationally intractable problem, because of the combinatorial explosion in the number of sets of attributes for which incidence-counts must be computed. Existing methods for dealing with this may involve multiple passes of the database, and tend still to cope badly with densely-packed database records. We describe here a class of methods we have introduced that begin by using a single database pass to perform a partial computation of the totals required, storing these in the form of a set enumeration tree, which is created in time linear to the size of the database. Algorithms for using this structure to complete the count summations are discussed, and a method is described, derived from the well-known Apriori algorithm. Results are presented demonstrating the performance advantage to be gained from the use of this approach. Finally, we discuss possible further applications of the method.  相似文献   

12.
秦梦娜  陈俊杰  郭浩 《计算机科学》2018,45(7):293-298, 314
现有的基于脑疾病的分类方法的研究使用的都是传统的低阶功能连接网络。低阶功能连接网络可能会忽略复杂的大脑区域之间动态的相互作用的模式。高阶功能连接网络能够反映网络中包含的丰富的动态时间信息,但原有的高阶功能连接网络使用聚类的方法降低了数据维度,使得构建的网络无法进行有效的神经学解释;其次,高阶功能连接网络由于规模较大,在利用复杂网络或图理论计算一些拓扑指标时消耗较大。基于此,提出了一种高阶最小生成树网络的构建方法,然后计算了传统的可量化网络指标(度和离心率)并结合频繁子图挖掘技术来挖掘具有判别能力的子网络,最后采用多核支持向量机进行分类。实验结果表明所提方法的分类精确度高达97.54%,获得了很好的分类性能。  相似文献   

13.
基于频繁模式树的关联规则增量式更新算法   总被引:48,自引:1,他引:48  
研究了大型事务数据库中关联规则的增量式更新总是,提出了一种基于频繁模式树的关联规则增量式更新算法,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

14.
基于极大团和FP-Tree的挖掘关联规则的改进算法   总被引:16,自引:0,他引:16  
融合了关联规则挖掘的FP-Tree算法和图论的极大团理论的优势,做了以下主要工作:(1) 提出了用邻接矩阵的产生频繁2-项集的改进方法;(2) 提出了极大有序频繁集的概念,证明了Head关系的等价性、划分定理、局部复杂性定理和归并收敛值域定理;(3) 提出并实现了基于极大团划分的MaxCFPTree算法,扫描时间复杂性小于O(n2);(4) 做了相关实验,以验证算法的正确性.新方法缓解了项目数量巨大而内存不足的矛盾,提高了系统效率和伸缩性.  相似文献   

15.
关联规则挖掘问题是数据挖掘中的研究热点,该文定义了事务树等概念及相关操作,在此基础上给出了仅需扫描一次事务数据库生成关联规则的算法Tree-DM。它利用项目树记录扫描信息,通过项目树的交操作生成事务树,进而利用事务树的交操作逐步产生频繁事务树,该算法的显著特点是能在发现频繁项目集的同时发现这些频繁项目集出现在哪些事务中,并就Tree-DM的性能进行了分析。  相似文献   

16.
关联规则挖掘能使你们发现大量数据中项目集之间有趣的关联或相关关系,通过研究发现,用传统关联规则方法会生成大量包含重复意义的规则,这必然会对用户迅速做出决策产生干扰。该文提出了一种基于邻接格的规则集压缩方法,使生成的规则大大精化,从而提供给用户简洁紧凑的关联规则集。  相似文献   

17.
黄鑫  罗军 《集成技术》2013,2(2):69-82
数据的快速增长,为我们提供了更多的信息,然而,也对传统信息获取技术提出了挑战。这篇论文提出了MCMM算法,它是基于MapReduce的大规模数据分类模型的最小生成树(MST)的算法。它可以看做是介于传统的KNN方法和基于聚类分类方法之间的模型,旨在克服这两种方法的不足并能处理大规模的数据。在这一模型中,训练集作为有权重的无向完全图来处理。顶点是对象,两点之间边的权重是对象间的距离。这一距离,不同于欧几里得距离,它是一个特定的距离度量。这样,可以找到图中最小生成树集,其中,图中每棵树代表一个类。为了降低时间复杂度,提取了每棵树中最具代表性的点来代表该树。这些压缩了的点集,可以通过计算无标签对象和它们之间的距离,来进行分类。MCMM模型基于MapReduce实现并且部署在Hadoop平台。该模型可扩展处理大规模的数据,是因为Hadoop支持数据密集分布应用,并且这些应用可以和数以千计的节点和数据一起运作。另外,MapReduce 和Hadoop能在由商品机组成的集群上很好的运行。MCMM模型使用云平台并且通过使用MapReduce 和Hadoop进行云计算是有益处的。实验采用的数据集包括从UCI数据库得到的真实数据和一些模拟数据,实验使用了4000个集群。实验表明,MCMM模型在精确度和扩展性上优于KNN和其他一些经常使用的基础分类方法。  相似文献   

18.
通过研究项集之间的关系,发现大项集之间存在着一种特定的关系,即k-项集一定是由一个(k-1)-项集加上一个单独的项构成的。基于这种项集关系,本文提出基于前缀树的TIUA算法,算法摆脱了传统算法多次迭代的不足,并利用挖掘出的结果,只需扫描一次数据库,就能满足各种要求,通过以空间换时间,达到提高挖掘效率的目的。  相似文献   

19.
基于最小生成树聚类的中文版面分割法   总被引:1,自引:1,他引:0       下载免费PDF全文
针对中文版面多横竖混排的特点,提出一种基于最小生成树聚类的版面分割方法。对原图像进行水平和垂直游程平滑,并对平滑后所得的连通域进行预分类处理,将文本进行横排、竖排分类。对预分类后的各类文本采用最小生成树聚类算法进行聚类处理。经实验,准确率达97%。实验表明,该方法对中文文档有良好的分割效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号