共查询到19条相似文献,搜索用时 46 毫秒
1.
多概念层次的数值关联规则挖掘 总被引:2,自引:0,他引:2
1 引言文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖掘算法进行挖掘。这种采用区间分割的方法来刻画数值属性,存在三点不足之处;1)致使信息丢失;2)经常使规则具有误导性; 相似文献
2.
关联规则的发现是整个数据挖掘课题中的重要组成部分。在归纳现有关联规则研究的基础上提出了事务间数值型关联规则的数据挖掘问题,并对该问题进行了定义。应用模糊理论和相关的数据挖掘技术,提出了解决该问题的E—QA算法,并以实例对算法可行性进行验证,指出了算法存在的一些问题以及今后解决这些问题的思路。 相似文献
3.
多数据库中负关联规则挖掘算法 总被引:1,自引:0,他引:1
现行的负关联规则挖掘主要是对于单一数据库的挖掘,但随着数据库技术的发展,多数据库挖掘越来越重要。当同时挖掘多数据库中的正负关联规则时,有可能会引起知识冲突问题,在前人对多数据库挖掘的基础上采用了一种关联规则合成模式,并利用相关性解决了知识冲突问题,最后用实验证明了该方法的正确性。 相似文献
4.
数据库中关联规则信息是知识的表述形式之一,负关联规则挖掘是数据库关联信息挖掘的重要研究内容,具有广泛的应用范围。现有的挖掘方法不能获取数据库中全部的负关联规则,考虑从数据库中提取全部的负关联规则,通过(1)扫描数据库建立数据库频繁模式树DFP-tree(Database Frequent Pattern tree);(2)在精简DFP-tree的基础上获取全部极小非频繁项集ASI;(3)对ASI中极大频繁项集的向上闭包,得到全部非频繁项集;(4)在此基础上采用相关度作为规则兴趣度量之一提取负关联规则。理论和实验表明算法的正确性和效率。 相似文献
5.
多数据库中全局负关联规则挖掘研究 总被引:1,自引:0,他引:1
全局负关联规则挖掘是多数据库关联信息挖掘的重要研究内容,具有广泛的应用范围和使用价值.合并各子数据库的负关联规则是现有全局负关联规则挖掘常用的方法,但数据密度大、规则不全面及运算时间高等问题影响了已有全局负关联规则挖掘方法的效率.本文给出一种新的全局负关联规则挖掘算法,其具体步骤为:(1)扫描各子数据库,建立多数据库频繁模式树;(2)依据频繁项集全局一致性原则,对多数据库频繁模式树执行精简操作;(3)在此基础上产生全局极小非频繁项集;(4)依据极大频繁项集向上闭包原则,产生全局非频繁项集;(5)在规则相关度的基础上提取全局负关联规则.大量的对比实验结果表明,本文算法具有快速发现全局负关联规则的能力. 相似文献
6.
7.
8.
数据库动态变化后,会使原有的一些规则无效,同时又会加入一些新的规则.重新挖掘费时费力,通常采用增量式挖掘来解决这一问题.对于数值型属性数据库,提出一种改进的增量式数值型关联规则挖掘算法,用于解决最小支持度不变,而数据库动态变化后引起的规则维护问题.引入了隶属函数的概念,说明参数隶属度的确定问题,并通过实例演示算法过程.结果表明该算法可大幅提高效率并可正确揭示数据所蕴涵的知识,具有很好的实用性. 相似文献
9.
10.
从数据库中发掘定量型关联规则 总被引:6,自引:0,他引:6
一、引言随着数据库技术和机器学习技术的发展,在数据库中发现新颖的、具有潜在效用的知识,简称KDD(Knowledge Discovery in Database)是近年来的一个新兴研究领域。KDD中的关联规则是描述数据库中数据项(属性,变量)之间所存在的(潜在)关系的规则。我们作如下形式化定义: 令I={i_1,i_2……,i_m}为项目集(itemset),D为事务数据库,其中每个事务T是一个项目子集(TI),并具有一个唯一的标识符ID。关联规则是形如XY的逻辑蕴含式,其中XT,YT,且X∩Y=φ。有两个因子与这条规则相关;如果事务数据库中有s%的事务包含X∪Y,那么我们说关联规则XY的支持度(support)为s;如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则XY的置信度(confidence)为c。 相似文献
11.
Machine-learning and data-mining techniques have been developed to turn data into useful task-oriented knowledge. Most algorithms for mining association rules identify relationships among transactions using binary values and find rules at a single-concept level. Transactions with quantitative values and items with hierarchical relationships are, however, commonly seen in real-world applications. This paper proposes a fuzzy multiple-level mining algorithm for extracting knowledge implicit in transactions stored as quantitative values. The proposed algorithm adopts a top-down progressively deepening approach to finding large itemsets. It integrates fuzzy-set concepts, data-mining technologies and multiple-level taxonomy to find fuzzy association rules from transaction data sets. Each item uses only the linguistic term with the maximum cardinality in later mining processes, thus making the number of fuzzy regions to be processed the same as the number of original items. The algorithm therefore focuses on the most important linguistic terms for reduced time complexity. 相似文献
12.
量化关联规则挖掘及算法 总被引:2,自引:0,他引:2
提出了一种新的量化关联规则挖掘算法QAR及其增量式更新算法IUQAR.算法以模糊集理论为基础,利用模糊概念表示量化属性属性间的关联关系,克服了传统的离散分区方法的不足,使得规则的表示自然、简明,有利于专家理解。同时,给出的算法IUQAR,有效地解决了规则的维护问题。 相似文献
13.
有效支持度和模糊关联规则挖掘 总被引:3,自引:0,他引:3
关联规则挖掘是数据挖掘的重要研究内容,将模糊的思想融入数据挖掘,形成的模糊关联规则的挖掘是当前关联规则研究的新方向,本文在模糊关联规则的挖掘中提出了有效支持度的概念,使其用于频繁模糊模式集的挖掘、挖掘的结果更为简洁和合理,同时挖掘的效率也得到了提高。 相似文献
14.
关联规则是数据挖掘研究中的一个重要的主题。一些算法都是假设数据中根本的关联基于时间是稳定的。然而,在现实世界领域,数据具有自己的特征,因此关联随着时间发生巨大的改变。现有的数据挖掘算法没有考虑关联的改变,这导致了严重的性能下降,特别是挖掘出的关联规则被用来分类和预测。尽管关联改变的挖掘是一个重要的问题,因为需要基于过去的历史数据来预测未来,现有的数据挖掘算法不符合这样的工作。文中引入模糊数据挖掘算法来发现基于时间的关联规则的改变。基于挖掘出的模糊规则,能预测关联规则在未来如何改变。实验表明了算法的有效性。 相似文献
15.
关联规则是数据挖掘研究中的一个重要的主题。一些算法都是假设数据中根本的关联基于时间是稳定的。然而,在现实世界领域,数据具有自己的特征,因此关联随着时间发生巨大的改变。现有的数据挖掘算法没有考虑关联的改变,这导致了严重的性能下降,特别是挖掘出的关联规则被用来分类和预测。尽管关联改变的挖掘是一个重要的问题,因为需要基于过去的历史数据来预测未来,现有的数据挖掘算法不符合这样的工作。文中引入模糊数据挖掘算法来发现基于时间的关联规则的改变。基于挖掘出的模糊规则,能预测关联规则在未来如何改变。实验表明了算法的有效性。 相似文献
16.
17.
关联规则是数据挖掘的重要研究内容之一。传统的关联规则挖掘算法仅适于处理二元属性与分类属性。为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法。该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法。引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解。实验表明该算法是有效的。 相似文献
18.
项目的分类通常是呈模糊类层次,该文基于模糊类层次的概念,讨论模糊关联规则支持度和置信度的计算,并给出挖掘广义模糊关联规则的两个扩展算法。 相似文献
19.