共查询到20条相似文献,搜索用时 78 毫秒
1.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。 相似文献
2.
文中基于对传统Apriori算法的改进,提出了一种基于规则的离群数据挖掘算法。该算法在数据结构中增加标识符链表后,计算了1-离群条件集的幂集,使得仅需对原数据库进行一次扫描,从而降低了该算法的时间复杂度。同时由于兴趣度的引入使得挖掘的结果也更有针对性和目的性。该算法被应用于某求职系统的离群数据分析中,实验表明该算法是可行有效的。 相似文献
3.
4.
5.
本文根据高校选课管理的情况,将关联规则挖掘技术中的FP-tree算法运用于高校选课管理的指导系统,对选课系统所积累的教学信息进行分析与挖掘,为高校选修课程的开设及学生选课提供决策支持,指导高校选课制度健康发展,提高教学水平。 相似文献
6.
目前衡量和生成关联规则的主要准则是考虑支持度和置信度阈值,而在实际应用中仅按此准则来挖掘是不够的, 这主要是因为关联规则的评价标准不合理产生的. 针对关联规则评价指标进行了深入的研究, 分析了“支持度-置信度”架构的局限性, 提出了基于相关性的兴趣度的评价指标PS公式, 根据其数学特性指出了它的优点与不足, 为关联规则评价体系的改进奠定了理论基础. 相似文献
7.
8.
研究关联规则的高效挖掘算法对于提高入侵检测的检测率和效率具有重要的意义.针对当前关联规则挖掘采用的支持度-置信度框架在具体应用中存在的问题,本文将PSA兴趣度模型和增量链表规则结合起来应用到入侵检测中,提出新的入侵检测方法-PSAIL.实验测试结果表明,该算法在挖掘速度、检测率上有较大提高,说明该算法的优化策略是有效的. 相似文献
9.
完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度-概率比-兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。 相似文献
10.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
11.
摘要:数据网格是在计算网格的基础上发展起来的网格技术,具有资源共享、协同工作、虚拟组织以及对分布式数据库群进行处理和分析的特点,在知识发现领域具有重要的研究价值。因此,本文提出了一种基于数据网格进行知识关联规则挖掘的方法。该方法采用数据网格树对动态数据网格进行全局控制和管理,采用挖掘作业命令的形式触发域挖掘作业,采用素数存储的方法进行了关联规则挖掘。通过仿真实验表明该挖掘方法在数据库群和数据网格关联规则挖掘方面具有优势。 相似文献
12.
13.
In this paper,a new effective method is proposed to find class association rules (CAR),to get useful class associaiton rules(UCAR)by removing the spurious class association rules (SCAR),and to generate exception class associaiton rules(ECAR)for each UCAR.CAR mining,which integrates the techniques of classification and association,is of great interest recently.However,it has two drawbacks:one is that a large part of CARs are spurious and maybe misleading to users ;the other is that some important ECARs are diffcult to find using traditional data mining techniques .The method introduced in this paper aims to get over these flaws.According to our approach,a user can retrieve correct information from UCARs and konw the influence from different conditions by checking corresponding ECARs.Experimental results demonstrate the effectiveness of our proposed approach. 相似文献
14.
关联是数据挖掘领域的一个重要研究课题。对模糊关联规则挖掘进行了研究,针对普通关联规则不能精确表达数据库中模糊信息关联性的问题,提出了一种新的模糊关联规则挖掘算法FARM_New,结果表明算法是有效的,提高了模糊挖掘的速度。 相似文献
15.
基于关联规则的本体相似度综合计算方法 总被引:1,自引:0,他引:1
目前较为流行的最小风险的本体映射(RiMOM)框架通过采用“多策略”的思想虽然取得了一定的效果,但其框架比较臃肿庞杂,且采用的计算结构相似度的选择策略存在一定的局限性。针对上述问题,提出一种基于关联规则的本体相似度综合计算方法。首先,构造关联规则的结构“树”模型,得出相应事务集;其次,进行关联规则的挖掘,根据关联规则计算概念结构的相似性;然后,计算概念的实例、属性、名称的相似度;最后,对多个特征相似度进行综合加权处理,实现本体相似度的最优计算。实验结果表明,该方法较RiMOM在查全率、查准率方面均有较大提高;同时该方法省去了策略选择的步骤,有效降低了时间复杂度。 相似文献
16.
基于日历的时序关联规则挖掘算法 总被引:2,自引:0,他引:2
以日历格作为框架来研究时序关联规则,提出了一个有效的挖掘算法。在用户指定的日历模式下,首先通过一次扫描产生所有的频繁2项集及相应的1*日历模式,在此基础上产生k*日历模式,并利用聚集性质产生候选K项集及相应的日历模式,最后扫描事务数据库产生所有的频繁项集及其日历模式。实验证明,该算法具有较好的性能。 相似文献
17.
关联规则在股票分析中的应用 总被引:4,自引:0,他引:4
应用Apriori算法的思想,采用变支持度和变置信度进行股票数据的一维和多维关系的 挖掘。不同于传统的以股票代码作为数据预处理的结果,本文采用股票的交易日期作为预处理的结 果,把交易日期所在的列号作为算法的直接处理对象,把交易日期作为其间接的处理对象。这样可以 方便快捷地挖掘出用户感兴趣的规则,同时也避免了在进行多维数据挖掘时需进行再处理的麻烦。 有代表性规则的验证证实了挖掘结果的正确性。 相似文献
18.
关联规则是数据挖掘的重要模式之一,有着极其重要的应用价值,但是传统的基于支持度-置信度框架的关联规则挖掘算法在实际应用中存在诸多不足。引入相关性分析,设计了一种基于遗传算法的正相关关联规则挖掘算法。最后,将该算法应用于名老中医临证经验分析挖掘的实际问题,实验证明,它能有效地弥补传统关联规则挖掘算法的不足。 相似文献
19.
首先对采用支持度、置信度和改善度阈值来选择关联规则的不足进行了分析,然后引入规则的鲁棒性分析,提出了基于lift 条件下的关联规则鲁棒性判断,能够在若干规则中选择出鲁棒性高的规则,提供决策参考,最后给出了实例应用。 相似文献
20.
《国际计算机数学杂志》2012,89(11):2233-2245
A data mining algorithm, such as Apriori, discovers a huge number of association rules (ARs) and therefore efficiently ranking all these rules is an important issue. This paper suggests a data envelopment analysis (DEA) method for ranking the discovered ARs using a maximum discrimination between the interestingness criteria defined for all ARs. It is shown that the proposed DEA model has a unique optimal solution which can be computed efficiently when the maximum discrimination between the criteria, the difference between DEA weights, is considered. The contribution of this study can be explained as follows: First, we show that using the conventional DEA model for ranking ARs may produce an invalid result because the weights corresponding to interestingness criteria would not discriminate between the criteria. This is investigated for a dataset consisting of 46 ARs with four criteria, namely support, confidence, itemset value and cross-selling. The paper also introduces the maximum discrimination between the weights of the criteria and obtains the optimal solution of the corresponding DEA model efficiently without the need of solving the related mathematical models. On the other hand, this model concludes less number of useful rule(s). A comparative analysis is then used to show the advantage of the proposed DEA method. 相似文献