首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。  相似文献   

2.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。  相似文献   

3.
1 引言数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。通常,经过某些数据挖掘工具的挖掘后,例如,文[1]所给出的快速算法,我们会得到大量的关联规则。对用户来说,从这些大量的规则中找出自己感兴趣的规则十分困难,而且,也  相似文献   

4.
基于兴趣度的关联规则挖掘算法   总被引:4,自引:0,他引:4  
马建庆  钟亦平  张世永 《计算机工程》2006,32(17):121-122,149
分析了Apriori核心算法,举例说明了其设计思想上的不足,并重新定义了关联规则形式和引进了兴趣度的概念。主要定义了合理的兴趣度,即基于可信度和支持度方差的兴趣度InterestR=[(CR-SRH)/4]^*(CR+SRH),并因此而设计了基于此兴趣度定义的关联规则挖掘算法,并对算法做了适当的分析。  相似文献   

5.
黄婷 《福建电脑》2010,26(9):83-85
本文根据高校选课管理的情况,将关联规则挖掘技术中的FP-tree算法运用于高校选课管理的指导系统,对选课系统所积累的教学信息进行分析与挖掘,为高校选修课程的开设及学生选课提供决策支持,指导高校选课制度健康发展,提高教学水平。  相似文献   

6.
目前衡量和生成关联规则的主要准则是考虑支持度和置信度阈值,而在实际应用中仅按此准则来挖掘是不够的, 这主要是因为关联规则的评价标准不合理产生的. 针对关联规则评价指标进行了深入的研究, 分析了“支持度-置信度”架构的局限性, 提出了基于相关性的兴趣度的评价指标PS公式, 根据其数学特性指出了它的优点与不足, 为关联规则评价体系的改进奠定了理论基础.  相似文献   

7.
关联规则挖掘是数据挖掘中重要的研究课题,对于如何从海量的信息中挖掘出有效的、可信的、可理解的、感兴趣的关联规则来帮助人们进行分析与决策,已经成为迫切需要解决的内容。现有的关联规则评价标准除了不能很好地满足用户需求外,还存在着含义和分类的不清晰性。本文在综合分析了现有的评价指标的基础上,提出了关联规则评价指标体系结构,明确了各评价指标的含义,并从系统论的角度将评价指标划分为基本评价指标、定量评价指标和定性评价指标三类,以帮助人们在应用评价时参考与使用。  相似文献   

8.
研究关联规则的高效挖掘算法对于提高入侵检测的检测率和效率具有重要的意义.针对当前关联规则挖掘采用的支持度-置信度框架在具体应用中存在的问题,本文将PSA兴趣度模型和增量链表规则结合起来应用到入侵检测中,提出新的入侵检测方法-PSAIL.实验测试结果表明,该算法在挖掘速度、检测率上有较大提高,说明该算法的优化策略是有效的.  相似文献   

9.
完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度-概率比-兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。  相似文献   

10.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

11.
摘要:数据网格是在计算网格的基础上发展起来的网格技术,具有资源共享、协同工作、虚拟组织以及对分布式数据库群进行处理和分析的特点,在知识发现领域具有重要的研究价值。因此,本文提出了一种基于数据网格进行知识关联规则挖掘的方法。该方法采用数据网格树对动态数据网格进行全局控制和管理,采用挖掘作业命令的形式触发域挖掘作业,采用素数存储的方法进行了关联规则挖掘。通过仿真实验表明该挖掘方法在数据库群和数据网格关联规则挖掘方面具有优势。  相似文献   

12.
针对学生成绩数据十分庞大的特点,提出一种Apriori算法的改进思想。首先,改变候选项集及频繁项集的存储方式———使用线性表分别用来存储项集、支持度最小的项、项集隶属的事务的TID、项集的支持度;然后,扫描项集中支持度最小的项所属于的事务而不是所有的事务来得到该项集的支持度,从而减少产生候选项集支持度的时间消耗;最后,找出频繁项集及关联规则。选择一万多学生的《计算机基础》成绩进行实验,实验结果表明,文理科生成绩达A的概率达到43%以上,艺体生成绩为C的概率达到32.16%。  相似文献   

13.
In this paper,a new effective method is proposed to find class association rules (CAR),to get useful class associaiton rules(UCAR)by removing the spurious class association rules (SCAR),and to generate exception class associaiton rules(ECAR)for each UCAR.CAR mining,which integrates the techniques of classification and association,is of great interest recently.However,it has two drawbacks:one is that a large part of CARs are spurious and maybe misleading to users ;the other is that some important ECARs are diffcult to find using traditional data mining techniques .The method introduced in this paper aims to get over these flaws.According to our approach,a user can retrieve correct information from UCARs and konw the influence from different conditions by checking corresponding ECARs.Experimental results demonstrate the effectiveness of our proposed approach.  相似文献   

14.
韩涛  张春海  李华 《计算机工程与设计》2005,26(7):1842-1844,1899
关联是数据挖掘领域的一个重要研究课题。对模糊关联规则挖掘进行了研究,针对普通关联规则不能精确表达数据库中模糊信息关联性的问题,提出了一种新的模糊关联规则挖掘算法FARM_New,结果表明算法是有效的,提高了模糊挖掘的速度。  相似文献   

15.
基于关联规则的本体相似度综合计算方法   总被引:1,自引:0,他引:1  
李华  苏乐 《计算机应用》2012,32(9):2472-2475
目前较为流行的最小风险的本体映射(RiMOM)框架通过采用“多策略”的思想虽然取得了一定的效果,但其框架比较臃肿庞杂,且采用的计算结构相似度的选择策略存在一定的局限性。针对上述问题,提出一种基于关联规则的本体相似度综合计算方法。首先,构造关联规则的结构“树”模型,得出相应事务集;其次,进行关联规则的挖掘,根据关联规则计算概念结构的相似性;然后,计算概念的实例、属性、名称的相似度;最后,对多个特征相似度进行综合加权处理,实现本体相似度的最优计算。实验结果表明,该方法较RiMOM在查全率、查准率方面均有较大提高;同时该方法省去了策略选择的步骤,有效降低了时间复杂度。  相似文献   

16.
基于日历的时序关联规则挖掘算法   总被引:2,自引:0,他引:2  
崔晓军  薛永生 《计算机应用》2006,26(8):1898-1899
以日历格作为框架来研究时序关联规则,提出了一个有效的挖掘算法。在用户指定的日历模式下,首先通过一次扫描产生所有的频繁2项集及相应的1*日历模式,在此基础上产生k*日历模式,并利用聚集性质产生候选K项集及相应的日历模式,最后扫描事务数据库产生所有的频繁项集及其日历模式。实验证明,该算法具有较好的性能。  相似文献   

17.
关联规则在股票分析中的应用   总被引:4,自引:0,他引:4  
柴明亮  宋苏 《计算机应用》2005,25(4):952-954
应用Apriori算法的思想,采用变支持度和变置信度进行股票数据的一维和多维关系的 挖掘。不同于传统的以股票代码作为数据预处理的结果,本文采用股票的交易日期作为预处理的结 果,把交易日期所在的列号作为算法的直接处理对象,把交易日期作为其间接的处理对象。这样可以 方便快捷地挖掘出用户感兴趣的规则,同时也避免了在进行多维数据挖掘时需进行再处理的麻烦。 有代表性规则的验证证实了挖掘结果的正确性。  相似文献   

18.
正相关关联规则及其在中医药中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
关联规则是数据挖掘的重要模式之一,有着极其重要的应用价值,但是传统的基于支持度-置信度框架的关联规则挖掘算法在实际应用中存在诸多不足。引入相关性分析,设计了一种基于遗传算法的正相关关联规则挖掘算法。最后,将该算法应用于名老中医临证经验分析挖掘的实际问题,实验证明,它能有效地弥补传统关联规则挖掘算法的不足。  相似文献   

19.
关联规则的鲁棒性分析与应用   总被引:1,自引:0,他引:1       下载免费PDF全文
首先对采用支持度、置信度和改善度阈值来选择关联规则的不足进行了分析,然后引入规则的鲁棒性分析,提出了基于lift 条件下的关联规则鲁棒性判断,能够在若干规则中选择出鲁棒性高的规则,提供决策参考,最后给出了实例应用。  相似文献   

20.
《国际计算机数学杂志》2012,89(11):2233-2245
A data mining algorithm, such as Apriori, discovers a huge number of association rules (ARs) and therefore efficiently ranking all these rules is an important issue. This paper suggests a data envelopment analysis (DEA) method for ranking the discovered ARs using a maximum discrimination between the interestingness criteria defined for all ARs. It is shown that the proposed DEA model has a unique optimal solution which can be computed efficiently when the maximum discrimination between the criteria, the difference between DEA weights, is considered. The contribution of this study can be explained as follows: First, we show that using the conventional DEA model for ranking ARs may produce an invalid result because the weights corresponding to interestingness criteria would not discriminate between the criteria. This is investigated for a dataset consisting of 46 ARs with four criteria, namely support, confidence, itemset value and cross-selling. The paper also introduces the maximum discrimination between the weights of the criteria and obtains the optimal solution of the corresponding DEA model efficiently without the need of solving the related mathematical models. On the other hand, this model concludes less number of useful rule(s). A comparative analysis is then used to show the advantage of the proposed DEA method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号