首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

2.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

3.
关联规则是一个应用广泛的数据挖掘算法,本文介绍了关联规则算法的工作原理,如何配置关联规则算法的参数及建立挖掘模型.结合一个高职院校的实例,对关联规则挖掘算法在专业课设置中的应用进行了研究,并对挖掘得到的结果进行了具体分析.  相似文献   

4.
基于综合度量的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陆晶  赛英 《计算机工程》2004,30(22):89-90,131
从确定性,有用性,简洁性和新奇性4个方面对规则进行综合度量,给出了规则长度和兴趣度约束的定义,在传统算法基础上提出了基于综合度量的关联规则挖掘算法,使关联规则的挖掘质量得到提高。  相似文献   

5.
基于矩阵与图的关联规则挖掘   总被引:5,自引:0,他引:5  
提出了一种新的算法,该算法是在基于图的关联规则挖掘的基础上进行研究,并提出改进。该算法与传统的关联规则挖掘算法Apfiofi算法相比,具有一定的优势,如复杂度低,无需多次扫描数据库等。  相似文献   

6.
数据挖掘中常用关联规则挖掘算法   总被引:6,自引:3,他引:3  
文中首先介绍了数据挖掘中关联规则的经典算法--Apiori算法.再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论.然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法.最后对关联规则挖掘的发展远景进行了展望.  相似文献   

7.
一种基于事务修剪的约束关联规则的挖掘算法   总被引:2,自引:0,他引:2  
陈义明  贺勇 《计算机应用》2005,25(11):2627-2629
针对一类常见而简单的规则中有项或缺项的约束,提出了一种基于事务数据修剪的约束关联规则的快速挖掘算法。该算法先扫描一遍数据库对事务进行水平和纵向的修剪,接着在修剪后的数据集上挖掘频繁项集,形成规则的候选头集、体集和规则项集,最后一次扫描后由最小可信度约束得到所要求的关联规则。实验表明,与按简洁约束采取的一般策略相比,该算法的性能有较明显的提高。  相似文献   

8.
一种新的广义关联规则挖掘算法   总被引:2,自引:0,他引:2  
通过对广义关联规则挖掘中的数据源的分析研究.采用分层抽样的数学方法筛选数据源.提出了一种效率更高的挖掘广义关联规则的新算法即分层抽样算法(Stratify Sample)SS,并进行了理论证明和分析.  相似文献   

9.
一种挖掘多维关联规则的有效算法   总被引:4,自引:0,他引:4  
1.引言挖掘大型事务数据库中的关联规则是数据挖掘研究的重要课题之一。由于关联规则在商务分析与决策、相关分析、分类等方面具有广泛应用,自提出以来一直受到广泛重视。一维关联规则的挖掘已有不少有效算法(如文,[2,3,4],综述参见文[l])。多维关联规则不仅考虑项集间的关联,而且考虑项集的维约束。这使得挖掘出的规则更具实用性,同时也增加了规则挖掘的难度。基于规则模板的挖掘,使用元规则限定挖掘的关联规则形式,降低了挖掘难度,但也使得其应用受到一定限制。采用类Apriori算法的方法通过求频繁谓词集得到多维关联规则,具有很好的可扩展性,能够处理大量数据,但其处理维谓词的1/O开销较大。利  相似文献   

10.
快速关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
高俊  施伯乐 《计算机科学》2005,32(3):200-201
本文在分析FP-growth关联规则挖掘算法的基础上,提出了一种称之为MFP的算法,给出了算法的工作原理。MFP算法能在一次扫描事务数据库过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。  相似文献   

11.
Today, development of e-commerce has provided many transaction databases with useful information for investigators exploring dependencies among the items. In data mining, the dependencies among different items can be shown using an association rule. The new fuzzy-genetic (FG) approach is designed to mine fuzzy association rules from a quantitative transaction database. Three important advantages are associated with using the FG approach: (1) the association rules can be extracted from the transaction database with a quantitative value; (2) extracting proper membership functions and support threshold values with the genetic algorithm will exert a positive effect on the mining process results; (3) expressing the association rules in a fuzzy representation is more understandable for humans. In this paper, we design a comprehensive and fast algorithm that mines level-crossing fuzzy association rules on multiple concept levels with learning support threshold values and membership functions using the cluster-based master–slave integrated FG approach. Mining the fuzzy association rules on multiple concept levels helps find more important, useful, accurate, and practical information.  相似文献   

12.
时变参数遗忘梯度估计算法的收敛性   总被引:7,自引:0,他引:7  
提出了时变随机系统的遗忘梯度辨识算法,并运用随机过程理论研究了算法的收敛 性.分析表明,遗忘梯度算法的性能类似于遗忘因子最小二乘法,可以跟踪时变参数,但计算量 要小得多,且数据的平稳性可以减小参数估计误差上界和提高辨识精度.阐述了最佳遗忘因子 的选择方法,以获得最小参数估计上界.对于确定性时不变系统,遗忘梯度算法是指数速度收 敛的;对于时变或时不变随机系统,遗忘梯度算法的参数估计误差一致有上界.  相似文献   

13.
CAIM discretization algorithm   总被引:8,自引:0,他引:8  
The task of extracting knowledge from databases is quite often performed by machine learning algorithms. The majority of these algorithms can be applied only to data described by discrete numerical or nominal attributes (features). In the case of continuous attributes, there is a need for a discretization algorithm that transforms continuous attributes into discrete ones. We describe such an algorithm, called CAIM (class-attribute interdependence maximization), which is designed to work with supervised data. The goal of the CAIM algorithm is to maximize the class-attribute interdependence and to generate a (possibly) minimal number of discrete intervals. The algorithm does not require the user to predefine the number of intervals, as opposed to some other discretization algorithms. The tests performed using CAIM and six other state-of-the-art discretization algorithms show that discrete attributes generated by the CAIM algorithm almost always have the lowest number of intervals and the highest class-attribute interdependency. Two machine learning algorithms, the CLIP4 rule algorithm and the decision tree algorithm, are used to generate classification rules from data discretized by CAIM. For both the CLIP4 and decision tree algorithms, the accuracy of the generated rules is higher and the number of the rules is lower for data discretized using the CAIM algorithm when compared to data discretized using six other discretization algorithms. The highest classification accuracy was achieved for data sets discretized with the CAIM algorithm, as compared with the other six algorithms.  相似文献   

14.
王明  宋顺林 《计算机应用》2010,30(9):2332-2334
发现频繁项集是关联规则挖掘的主要途径,也是关联规则挖掘算法研究的重点。关联规则挖掘的经典Apriori算法及其改进算法大致可以归为基于SQL和基于内存两类。为了提高挖掘效率,在仔细分析了基于内存算法存在效率瓶颈的基础上,提出了一种发现频繁项集的改进算法。该算法使用了一种快速产生和验证候选项集的方法,提高了生成项目集的速度。实验结果显示该算法能有效提高挖掘效率。  相似文献   

15.
一种高效的关联规则挖掘算法研究   总被引:2,自引:1,他引:2  
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则。文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法。与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备。  相似文献   

16.
棋类游戏是博弈的规则和思想的完美体现,很多算法技术都可以运用在棋类游戏中。五子棋相比其他棋类,规则更简单易学,适合用于博弈算法的研究。一个五子棋博弈平台的搭建,有利于不同博弈算法之间的比较研究以及改进。该文首先介绍了五子棋博弈平台的设计。该平台是包括一个服务器和两个客户端的三层C/S架构平台,主要用于五子棋博弈算法之间的对弈。其次,该文以遗传算法及搜索树算法的对弈为例,展示了该平台的应用。  相似文献   

17.
Location awareness is now becoming a vital requirement for many practical applications. In this paper, we consider passive localization of multiple targets with one transmitter and several receivers based on time of arrival (TOA) measurements. Existing studies assume that positions of receivers are perfectly known. However, in practice, receivers' positions might be inaccurate, which leads to localization error of targets. We propose factor graph (FG)-based belief propagation (BP) algorithms to locate the passive targets and improve the position accuracy of receivers simultaneously. Due to the nonlinearity of the likelihood function, messages on the FG cannot be derived in closed form. We propose both sample-based and parametric methods to solve this problem. In the sample-based BP algorithm, particle swarm optimization is employed to reduce the number of particles required to represent messages. In parametric BP algorithm, the nonlinear terms in messages are linearized, which results in closed-form Gaussian message passing on FG. The Bayesian Cramér–Rao bound (BCRB) for passive targets localization with inaccurate receivers is derived to evaluate the performance of the proposed algorithms. Simulation results show that both the sample-based and parametric BP algorithms outperform the conventional method and attain the proposed BCRB. Receivers' positions can also be improved via the proposed BP algorithms. Although the parametric BP algorithm performs slightly worse than the sample-based BP method, it could be more attractive in practical applications due to the significantly lower computational complexity.  相似文献   

18.
曾安平 《计算机应用》2012,32(8):2198-2201
针对传统关联规则算法产生的规则关联性弱、种类少的缺点,结合Spearman秩相关系数,提出了一种多类关联算法。该算法在传统算法产生的强规则基础上,利用Spearman秩相关方法计算出规则中产品间的同步异步等相关性。将其作为兴趣度阈值,算法可同时产生同步正规则、异步正规则、同步负规则和异步负规则四类关联规则,且规则间联系紧密。实验结果表明了算法的有效性和优越性。  相似文献   

19.
一种挖掘带否定关联规则的算法   总被引:4,自引:0,他引:4       下载免费PDF全文
关联规则挖掘算法的研究主要集中在提高Aptiori算法的效率上,而对带否定项关联规则的研究比较少。本文分析了目前带否定关联规则的两种基本算法,并在这两种基本算法的基础上进行改进。提出了一种新的挖掘算法。这种算法减少了在数据库中进行扫描计数的候选集个数,对于提高挖掘带否定关联规则的效率有一定的意义。  相似文献   

20.
谷波  李茹  刘开瑛 《计算机科学》2010,37(1):229-232
在自然语言处理中,句法分析主要有基于统计的方法和基于规则的方法。Earley算法是一种基于规则的方法,可以分析任意上下文无关文法(CFG),而不需要对文法进行修改。详细分析了Earley算法的特点。在通常的Earley算法中增加了多种预测机制,这些预测机制借鉴了LL,LR以及SLR等确定性分析算法的一些思想,并对这几种不同的预测机制及其组合在相同条件下进行了中文句法分析实验。结果显示,引入这些预测机制通常可以减少产生项目的数量,从而节省存储空间,减少运行时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号