首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
王培培  孟芸 《计算机仿真》2021,38(5):282-286
针对传统数据关联挖掘过程只适用于单段数据集,导致内存负担重、挖掘频繁项集效率不高等问题,提出一种多段支持度数据频繁模式关联规则挖掘方法.运用多支持度算法对数据集逐步搜索,数据集按照数据项的MIS大小有序排列,采用最小值作为最小支持度,确保该算法的地推性.构建FP_ tree树,利用FP_tree算法对待选项实施剪枝,从而准确挖掘出频繁模式的关联规则.仿真结果证明,多段支持度数据频繁模式关联规则挖掘具有较好的性能,有效提高了关联规则的挖掘效率.  相似文献   

2.
简单数据集可以通过关联规则得到在数据间的相互关系;相当多的情况下,由于不能从关联规则得到隐藏在数据间的相互关系,需要按间接关联规则分析出数据项集在交易集合中出现的频度,挖掘隐藏在数据间的相互关系。文中通过使用概念分层和基于近邻的方法,探讨利用FP树产生的频繁项集,对候选关联检验其是否满足项对支持度条件,并利用这个频繁项集挖掘事务的间接关联,找到挖掘事务的间接关联的内在规律,构造出不依赖中介条件的间接关联挖掘算法。  相似文献   

3.
王玮  陈恩红 《计算机工程》2000,26(9):17-18,29
关联规则的挖掘是一个重要的数据挖掘问题,目前的算法主要是研究基于支持-信任框架理论的关联规则挖掘,但是基于支持-信任框架理论的关联规则只适用于交易类型的数据库,然而现实的数据库中有许多连续数据,经典的关联规则就不适用了。该文介绍一种对连续数据集进行预处理过程,即对数据库中的数据项进行距离划分,并给出基于聚类方法的算法设计思想。  相似文献   

4.
连续数据的分割及关联规则发现   总被引:2,自引:1,他引:1  
关联规则的挖掘是一个重要的数据挖掘问题,目前的算法主要是研究基于支持-信任框架理论的关联规则挖掘,但是基于支持-信任框架理论的关联规则只适用于交易类型的数据库,然而现实的数据库中有许多连续数据,经典的关联规则就不适用了.该文介绍一种对连续数据集进行预处理过程,即对数据库中的数据项进行距离划分,并给出基于聚类方法的算法设计思想.  相似文献   

5.
基于关联规则挖掘的生化企业数据分析及其应用研究   总被引:1,自引:0,他引:1  
生物化工产品的工业生产,要求有合适的生产环境,由于生产过程的复杂性,掌握适宜的生产环境较为困难.数据挖掘是从现有数据中找规律,可以从历史数据中,找出关联模式,从而获取对决策目标有利的生产环境条件.本文针对生物化工(生化)企业生产的数据特征,基于关联规则挖掘,分析生化企业生产数据,同时结合目前大多数关联规则挖掘算法的数据模型要求,重点论述了环境因子和环境因子数据项的关系,提出将原始数据指标分割成数据项,及分割后的数据项合并为决策目标的方法.由于生化企业生产决策目标的确定性,提出了具有确定性决策项时关联规则挖掘的优化算法,可快速地挖掘感兴趣的频繁数据项集.在此基础上,开发了具有数据预处理(环境指标分割)、关联知识发现、结果生成的应用系统,对系统做了初步试验和分析,从系统输出的结果中,可以辅助企业进行生产环境的优化.研究表明,用关联规则挖掘分析生化企业数据是有效的.  相似文献   

6.
一个最优分类关联规则算法   总被引:1,自引:0,他引:1  
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。  相似文献   

7.
运用模糊集挖掘数量属性数据的关联规则   总被引:3,自引:0,他引:3  
王咏  申瑞民 《计算机仿真》2004,21(8):129-131
绝大多数关联规则的挖掘方法基于布尔属性数据,但在现实应用中会经常需要对数量属性的数据进行关联挖掘。该文就提出一种算法,在经典Apriori后选集算法的基础上引入了模糊逻辑集合的概念,将数据集中的数量属性按照模糊集合定义进行划分从而将原始事务数据转化成基于模糊集的数据,然后再运用Apriori算法发现潜在的关联规则。  相似文献   

8.
针对传统关联规则表示方式无法展现领域知识、数据项间的关系及规则中所隐含的信息等问题,提出了一种基于概念图的关联规则知识表示方法,该方法包括模式定义和模式解析,其结合概念图理论可将关联规则转换成概念图的知识表示形式。给出了关联规则的概念图知识表示算法,并以某省全员人口数据为数据源对算法进行了具体实现和分析。实验结果表明,该方法在人口信息表现方面具有良好的效果。  相似文献   

9.
基于多维数据模型的交叉层关联规则挖掘   总被引:3,自引:0,他引:3  
多层关联规则是带有一定概念分层的关联规更哇,它描述了不同抽象级别上数据项之间的关联性,且不同级别上的关联性具有不同的指导意义.但目前已讨论的多层关联规则,大都局限于挖掘同一抽象层上数据项之间的关联,因而,针对这一问题,本文对已有的FP—Tree算法进行扩充和改进,实现了既能挖掘同一抽象层上也能挖掘不同抽象层上数据项之间关联性的多层关联挖掘算法,即交叉层关联规则挖掘算法FP—Tree*.同时,在算法实施之前,还结合多层关联挖掘本身的特点,对现有的数据存储结构进行改进,提出用字符序列对事务项编码的方法,从而简化了大量的数据预处理工作.  相似文献   

10.
通过对数据挖掘的经典Apriori算法和基于线性链表的关联规则挖掘算法进行研究,发现其中的不足--多次扫描数据且生成大量候选项集,增加了计数时间和内存空间.针对以上情况提出了基于候选项集分组的关联规则挖掘算法,该算法主要改进数据仅一次扫描和对候选项集进行分组计数,且动态创建候选项集的集合,有效地缩短了计数时间和占用的内存空间,使挖掘的效率更好更快.实验结果表明,该算法比文献[1]的算法效率更高.  相似文献   

11.
王明  宋顺林 《计算机应用》2010,30(9):2332-2334
发现频繁项集是关联规则挖掘的主要途径,也是关联规则挖掘算法研究的重点。关联规则挖掘的经典Apriori算法及其改进算法大致可以归为基于SQL和基于内存两类。为了提高挖掘效率,在仔细分析了基于内存算法存在效率瓶颈的基础上,提出了一种发现频繁项集的改进算法。该算法使用了一种快速产生和验证候选项集的方法,提高了生成项目集的速度。实验结果显示该算法能有效提高挖掘效率。  相似文献   

12.
基于粗糙集的多维关联规则挖掘方法   总被引:1,自引:0,他引:1  
海量的数据使得关联规则挖掘非常耗时,而并非所有的规则都是用户感兴趣的,应用传统的挖掘方法会挖掘出许多无关信息。此外,目前大部分算法是针对单维规则的。因此,定义了一种挖掘语言使得用户可以指定感兴趣的项以及关联规则的参数(如支持度,置信度等),并提出一种基于粗糙集理论的多维关联规则挖掘方法,动态生成频繁集和多维关联规则,减少频繁项集的生成搜索空间。实例分析验证该算法的可行性与有效性。  相似文献   

13.
针对基于Spark框架的关联规则算法存在I/O开销大、数据结构和挖掘频繁集方式单一、计算支持度的方式效率低等问题,提出基于SparkSql进行分布式编程的算法。将数据集加载到DataFrame,利用改进后的布隆过滤器高效存储频繁集挖掘过程中产生的项集,解决RDD内存资源和计算速度受限问题。基于先验定理对事务、项目和项集进行精简,同时提出用Sql语句对项集中项目对应事务集合求交集的方式计算项集支持度,提高计算支持度的效率。提出了两种迭代算法和自适应数据的选择条件,增强该算法对各种数据集的泛化性。进行多组实验,证明提出的算法总是自适应本次迭代数据的特点选择最优的迭代方法,同时具有较高并行算法性能,可以扩展到更大规模集群和数据;同基于Spark框架的关联规则算法YAFIM和R-Apriori进行对比,在每次迭代和总体运行计算效率上有更好的表现。  相似文献   

14.
贾桂霞  张永 《计算机工程与设计》2006,27(12):2175-2177,2186
在数据挖掘领域,关联规则的挖掘和基于粗糙集理论抽取决策规则是两种截然不同的方法,但在统计意义下两种方法产生的规则基本相同。结合关联规则挖掘方法和粗糙集方法的优点,基于Apriori算法提出一种优化算法,获取具有一定支持度和可信度阈值且不产生冗余的决策规则,以提高粗糙集属性值约简算法的性能。  相似文献   

15.
目前的数据挖掘基本上都是基于普通数据集的挖掘,针对星型模式结构的数据挖掘的研究工作较少,为此定义星型模式挖掘结构,并在此基础上构建一种关联规则挖掘算法,该算法先扫描事实表,产生最大频繁项集和关联规则,进而以此为基础,提出一种基于连接条件和关联规则局部有效性的理论,并在此基础上建立一种快速扫描维表属性的方法,一次产生维表隐藏的关联规则,这个扫描是基于局部的,不是基于全局的,同时可根据需要,对于不明确的关联规则,通过构建扩展的维表,进行隐知识的挖掘。算法挖掘速度快,若合理地构建扩展维表,能够发现扩展的隐藏信息。  相似文献   

16.
The amount of ontologies and semantic annotations available on the Web is constantly growing. This new type of complex and heterogeneous graph-structured data raises new challenges for the data mining community. In this paper, we present a novel method for mining association rules from semantic instance data repositories expressed in RDF/(S) and OWL. We take advantage of the schema-level (i.e. Tbox) knowledge encoded in the ontology to derive appropriate transactions which will later feed traditional association rules algorithms. This process is guided by the analyst requirements, expressed in the form of query patterns. Initial experiments performed on semantic data of a biomedical application show the usefulness and efficiency of the approach.  相似文献   

17.
针对贴片机的数据挖掘课题中,关联规则生成规则数较多而不易于分析的问题,研究了单决策属性作为规则后件的方法,对实际应用中存在条件约束的情况进行了分析,提出了基于决策属性的关联规则挖掘优化算法。应用结果表明这样得到的规则简洁明确,规则具有实用价值,并且频繁集优化的效果显著,达到了快速挖掘的目的。  相似文献   

18.
数据挖掘是从数据库中发现潜在有用知识或者感兴趣模式的过程。在数据挖掘领域中主要集中于单一支持度下的关联规则挖掘,在事务数据库中发现项目之间的关联性,而在实际应用中,项目可以有不同的最小支持度,不同的项目可能具有不同的标准去判断其重要性,因此提出一个在最大值支持度约束下,发现有用的模糊关联规则挖掘算法,在该约束下,利用逐层搜索的迭代方法发现频繁项目集,通过实例证明了该挖掘算法是易于理解和有意义的,具有很好的效率。  相似文献   

19.
基于Web数据挖掘的高效关联规则研究   总被引:4,自引:0,他引:4  
随着网络资源越来越丰富,Web数据挖掘逐渐成为因特网上资源有效利用的研究热点。本文提出通过对因特网上非结构化数据的XML格式进行筛选等处理,然后转化为结构化数据存储在SQL Server数据库中。并在此基础之上利用关联规则发现以生成最小关联规则集来代替完全关联规则集,就可以有效地剪除弱关联规则,大幅度地减少候选频繁项目目集,从而提高规则发现效率。最后,在传统经典算法Apriori基础上,利用弱关联规则的向上关闭特性设计了一个相应的高效算法。  相似文献   

20.
在关联规则挖掘算法中,Apriori由于多次对数据库进行扫描会产生较多的候选集,在多次扫描数据库的情况下容易产生I/O开销问题,并引起数据挖掘效率低.矩阵关联规则在数据挖掘过程中没有删除非频繁项集,致使存在较多的无效扫描,对于挖掘效率的提高也不明显.该文提出了一种改进的矩阵和排序索引关联规则数据挖掘算法,首先,删除不需...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号