首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
采掘关联规则的高效并行算法   总被引:33,自引:1,他引:32  
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。  相似文献   

2.
用数据查询语言实现关联规则采掘   总被引:2,自引:1,他引:2  
关联规则采掘具有广阔的应用前景。文章讨论了关联规则的用途、内涵,分析了关联规则采掘的算法,给出了在DBMS平台上用数据查询语言实现关联规则采掘的程序。测试表明,实现的算法对关联规则采掘十分有效。  相似文献   

3.
用数据查询语言实现关联规则脂掘   总被引:1,自引:0,他引:1  
关联规则采掘具有广阔的应用前景。文章讨论了关联规则的用途,内涵,分析了关联规则采掘的算法,给出了在DBMS平台上用数据查询语言实现关联规则采掘的程序。测试表明,实现的算法对关联规则采掘十分有效。  相似文献   

4.
关联规则采掘综述   总被引:36,自引:5,他引:36  
介绍了关联规则采掘问题的研究情况,对一些典型采掘算法进行了分析和评价。指出了关联规则衡量标准的不足,展望了关联规则采掘的未来研究方向。  相似文献   

5.
关联规则衡量标准的研究   总被引:8,自引:0,他引:8       下载免费PDF全文
罗可  吴杰 《控制与决策》2003,18(3):277-280
关联规则采掘是数据采掘中重要的研究课题。针对当前关联规则采掘中可能产生许多无效关联规则的问题,分析其原因,提出在衡量标准中增加有效度,并给出了有效度的定义。根据有效度的大小,将关联规则分为正关联规则、无效关联规则、负关联规则,提出了新衡量标准采相关联规则的算法,并用Visual FoxPro进行了试验。实验表明,新方法能明显减少无效关联规则的数目。  相似文献   

6.
兴趣度--关联规则的又一个阈值   总被引:51,自引:3,他引:51  
关联规则的采掘是数据采掘研究的一个重要方面,分析现有的关联规则采掘算法中所存在的问题:首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响,因而导致知识表达功能的不够完善;其次是有可能一条规则即使可信度和支持度都很高,仍没有实际意义,甚至是误导性的,因此对关联规则的形式定义作了修改,将运用差异思想引兴起度阈值运用到关联规则中来,并给出其形式定义,在分析了兴趣度的实际意义以后,讨论了举度与概  相似文献   

7.
一种基于Apriori的改进算法   总被引:16,自引:1,他引:15  
关联规则采掘是数据采掘中重要的研究课题。该文对关联规则采掘中的Apriori算法进行了深入研究。作者探讨了Apriori算法,指出了该算法的某些不足,提出了一种改进算法。  相似文献   

8.
基于概念格的关联规则挖掘   总被引:2,自引:0,他引:2  
关联规则的挖掘是知识发现领域重要的研究方向之一,因此开展这方面的研究是很有意义的。论文给出了一种基于概念格的关联规则的算法,该算法首先通过约化形式背景,然后通过给定的阈值在约简的背景上建格,最后在格上提取符合条件的关联规则。例子说明了该算法的可行性和有效性。  相似文献   

9.
采掘关联规则是数据采掘的重要研究内容.本文针对交易项目中广泛存在的包含和泛化关系,充分利用已采掘出交易项目集的频繁模式集合,提出了一种快速的基于概念提升的多层次关联规则更新采掘方法与算法UMARCP.  相似文献   

10.
高频规则发现作为关联规则发现的子问题,在许多重要的教据挖掘领域中起着关键的作用。经典的高频规则发现算法是一个多次遍历的算法,计算的复杂度较高。对高频规则算法的关键思想以及性能进行了研究,给出了高频规则发现算法Apriori的改进算法,并应用于大学生个性分析。该算法有效地提高了原算法的性能,对Apriori算法的各种变形同样适用。  相似文献   

11.
一种基于约简概念格的关联规则快速求解算法   总被引:4,自引:2,他引:2  
关联规则挖掘是数据挖掘领域中重要的研究分支,已形成了较多的研究成果。然而,大多数基于频繁项集求解关联规则的挖掘算法需要多次扫描数据库。该文提出了一种基于概念格的关联规则快速求解算法,该算法仅需一次扫描数据库即可确定所有的频繁项集并且进而能够快速求解出关联规则。文章首先讨论了约简概念格(RECL)的构造原理,并详细描述了基于RECL的关联规则的挖掘算法,最后以实验证明了算法的正确性和优越性。  相似文献   

12.
约束关联挖掘是在把项或项集限制在用户给定的某一条件或多个条件下的关联挖掘,是一种重要的关联挖掘类型,在现实中有着不少的应用。但由于大多数算法处理的约束条件类型单一,提出一种多约束关联挖掘算法。该算法以FP-growth为基础,创建项集的条件数据库。利用非单调性和单调性约束的性质,采用多种剪枝策略,快速寻找约束点。实验证明,该算法能有效地挖掘多约束条件下的关联规则,且可扩展性能很好。  相似文献   

13.
刘茜萍  韩京宇 《计算机工程》2011,37(17):44-45,57
在关系型规则和活动型规则形式描述工作流合并需求的基础上,提出一种基于可达关系的合并规则冲突检测算法。通过记录每条规则应用后的可达关系矩阵,以及新增可达关系对应的规则集方式,为合并规则集中存在冲突的若干规则组合进行较为准确的定位。实例分析表明,该算法为规则集的合理调整提供直接依据,可有效实施工作流的合并。  相似文献   

14.
基于用户兴趣的FP-TREE算法的改进及应用   总被引:1,自引:0,他引:1  
关联规则主要通过历史数据来找出某些隐性的规律,但是针对不同用户,不同的规则更为有效,因此如何找出比较有价值的规则引起了人们的广泛关注。提出一种基于用户兴趣模型的改进关联规则算法,该算法从用户分类的角度找到适合不同用户的不同规则。通过在学校教学评估中的应用,验证了算法的有效性。  相似文献   

15.
随着互联网上的信息迅速增长,如何快速准确地寻找到信息越来越受到人们的重视。文中给出了几种计算用户兴趣度的方法,并利用其中一种计算用户兴趣度的方法,论述了基于兴趣度的Web页面关联规则。论述了关联规则和一般的Apriori算法,并利用了"壹支持数下K—关联规则",对一般的Apriori进行了改进,主要是将兴趣度用于Apriori算法中。实验结果证明,该方法用于在网上寻找用户感兴趣的信息具有较好的准确率。  相似文献   

16.
林闯  陆维明 《软件学报》1994,5(11):23-30
本文为推理维护系统引入一种Petri网模型并对有限非单调理论应用Petri例分析方法.本文提议的模型不但能描述推理维护系统,而且可用网论与网技术分析推理维护.对于一组给定的非单调规则我们给出一个算法可求得其外延,我们还给出一个算法可发现系统的不一致性.我们提出的寻找外延的算法要比现有的重构过程更有效,且它是可判定的.  相似文献   

17.
Text classification is usually based on constructing a model through learning from training examples to automatically classify text documents. However, as the size of text document repositories grows rapidly, the storage requirement and computational cost of model learning become higher. Instance selection is one solution to solve these limitations whose aim is to reduce the data size by filtering out noisy data from a given training dataset. In this paper, we introduce a novel algorithm for these tasks, namely a biological-based genetic algorithm (BGA). BGA fits a “biological evolution” into the evolutionary process, where the most streamlined process also complies with the reasonable rules. In other words, after long-term evolution, organisms find the most efficient way to allocate resources and evolve. Consequently, we can closely simulate the natural evolution of an algorithm, such that the algorithm will be both efficient and effective. The experimental results based on the TechTC-100 and Reuters-21578 datasets show the outperformance of BGA over five state-of-the-art algorithms. In particular, using BGA to select text documents not only results in the largest dataset reduction rate, but also requires the least computational time. Moreover, BGA can make the k-NN and SVM classifiers provide similar or slightly better classification accuracy than GA.  相似文献   

18.
Mining association rules plays an important role in data mining and knowledge discovery since it can reveal strong associations between items in databases. Nevertheless, an important problem with traditional association rule mining methods is that they can generate a huge amount of association rules depending on how parameters are set. However, users are often only interested in finding the strongest rules, and do not want to go through a large amount of rules or wait for these rules to be generated. To address those needs, algorithms have been proposed to mine the top-k association rules in databases, where users can directly set a parameter k to obtain the k most frequent rules. However, a major issue with these techniques is that they remain very costly in terms of execution time and memory. To address this issue, this paper presents a novel algorithm named ETARM (Efficient Top-k Association Rule Miner) to efficiently find the complete set of top-k association rules. The proposed algorithm integrates two novel candidate pruning properties to more effectively reduce the search space. These properties are applied during the candidate selection process to identify items that should not be used to expand a rule based on its confidence, to reduce the number of candidates. An extensive experimental evaluation on six standard benchmark datasets show that the proposed approach outperforms the state-of-the-art TopKRules algorithm both in terms of runtime and memory usage.  相似文献   

19.
生产预制构件所使用的模具在模台上的组合分配受多种因素影响,会产生多种组合分配结果。为了解决这类问题,快速找到模具在模台上的最佳分配结果,提出一种基于回溯法与改进的Eclat算法结合的模具组合方法。首先基于历史数据中的模具组合关系构建二叉树模型,通过回溯法对二叉树进行搜索,得到所有理论上可行的模具组合结果;再通过使用改进的BL定位算法将这些组合结果在固定面积的模台上进行预放置,从中筛选出符合实际放置条件的模具组合结果;应用Eclat算法从已筛选出的组合结果中获取最优模具适配组合集,进而确定不同型号模具间的关联规则,并将其用于指导新构件生产任务中模具在模台上的分配过程;同时通过引入划分思想和突出基于概率的先验约束思想改进Eclat算法,提升其在处理大规模数据时的运行效率。最后通过采用预制构件生产企业中的实例数据进行仿真测试,验证了该方法对快速解决模具模台组合分配问题的有效性。  相似文献   

20.
一种改进的关联规则的增量式更新算法   总被引:1,自引:0,他引:1  
增量关联规则挖掘的主要思想是在原有规则的基础上,去除那些不满足条件的旧规则,发现满足条件的新规则,目的是尽量减少计算量.增量规则算法主要解决两类问题,即最小支持度的更新和数据库的更新.目前大多数算法对上述两个条件只更新其中一个,另一个保持不变,而实际应用中往往需要两者都更新.通过对数据挖掘中的IUA算法和FUP算法的分析和研究,提出IFU算法,用于解决数据库和最小支持度均发生改变时关联规则的增量式更新问题.相对于IUA算法和FUP算法以及基于他们改进的算法,该算法不仅扩展了更新条件,而且减少了对事务数据库和新增数据库的扫描次数.模拟实验表明IFU算法提高了更新效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号