共查询到19条相似文献,搜索用时 187 毫秒
1.
2.
3.
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。 相似文献
4.
适合于高效更新的关联规则挖掘算法 总被引:6,自引:0,他引:6
周海岩 《小型微型计算机系统》2004,25(4):634-637
实用的关联规则挖掘算法,为了发现事先未知的关联规则,用户需要通过对最小支持度和最小可信度这两个阈值的不断调整来逐步聚焦到那些真正令其感兴趣的关联规则上去,这将是一个动态的交互过程,因此,迫切需要高效的更新算法来满足用户对较快的响应时间的需求,基于这种思想,并深入分析了已有的诸关联规则挖掘与更新算法且指出其共同存在的问题与不足,在此基础上,提出一种当数据库数据不变时,仅扫描数据库一次,即可反复调整最小支持度和最小可信度进行关联规则挖掘与更新的高效、实用的算法,特别在对关联规则进行更新时,该算法对最初和前次挖掘过程中所得到的信息加以充分的利用,从而对关联规则进行更新时算法的执行效率得到进一步的提高,并对算法进行了分析与讨论. 相似文献
5.
模糊Horn子句规则挖掘算法研究 总被引:1,自引:0,他引:1
模糊关联规则可以用自然语言来表达人类知识,受到数据挖掘与知识发现研究人员的广泛关注。但是,目前大多数模糊关联规则挖掘方法仍然基于经典关联规则的支持度和可信度测度。从模糊蕴涵的观点出发,定义了模糊Horn子句规则、支持度、蕴涵强度以及相关概念,提出了模糊Horn子句规则挖掘算法。该算法可以分解为3个步骤。首先,将定量数据库转换为模糊数据库。其次,挖掘模糊数据库中所有支持度不小于指定最小支持度阂值的频繁项目集。一旦得到了所有频繁项目集,就可以用一种直接的方法生成所有蕴涵强度不小于指定最小蕴涵强度阂值的模糊Horn子句规则。 相似文献
6.
邓广彪 《数字社区&智能家居》2014,(11):7237-7240
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。 相似文献
7.
邓广彪 《数字社区&智能家居》2014,(31):7237-7240,7243
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。 相似文献
8.
9.
王伟勤 《计算机与数字工程》2007,35(11):24-27
关联规则挖掘已取得了许多有效的算法,但是当事物数据库发生动态变化时,或数据库保持不变,而最小支持度和最小可信度发生变化时,关联规则的高效更新仍然是个复杂的问题.给出一种新的关联规则的挖掘算法.新的算法只需扫描数据库D一次,减少了I/O次数,为关联规则的更新打下很好的基础. 相似文献
10.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
11.
作为挖掘算法选择和评价的标准之一,数据集的分类不一致程度一直是分类规则研究中的一项重要内容.然而随着人们对不完备数据集数据挖掘的深入,建立在等价关系上的基于信息熵的评价方法已难以满足实际需要.文中在利用相似关系的基础上,结合证据理论,给出一种基于信任度与似然度的信息粒构建方法,同时构建了类似于不协调度和混淆度的系统分类不一致程度评价方法,并对其相关性质等进行分析与证明.由算例分析可以看出,文中研究结果能够较好地描述缺失环境下的系统分类不一致程度,同时当数据集不存在缺失时,该研究与以往研究具有相同结果. 相似文献
12.
13.
将关联规则发现算法引入到中药配方数据库的数据挖掘中,以求发现方剂中单方之间的关联规则及中药中的药对药组,可以为中药中新药的研制提供重要依据。由于常用的关联规则发现算法:Apriori算法存在多次扫描数据库的缺陷,提出了一种基于矩阵的关联规则发现算法:Apriori_Matrix算法,该算法优化了Apriori算法中集合连接过程多次比较所花费的时间,可极大地提高关联规则挖掘的效率。针对中药数据库中单方的种类有限、配伍规则各不相同、同一种病症对应多种方剂的情况,改进算法有助于缩短新药研制的周期。 相似文献
14.
Databases for data mining often have missing values. Missing data are often mistreated in data mining and valuable knowledge related to missing data is often overlooked. This study discusses patterns of missing data in survey databases. It proposes a framework of rough set rule induction method that enables the data miner to obtain association rules of patterns of missing data in a survey database. Through an experiment on a real-world data set, we demonstrate the approach to discovering knowledge about missing data. 相似文献
15.
A new approach to online generation of association rules 总被引:6,自引:0,他引:6
We discuss the problem of online mining of association rules in a large database of sales transactions. The online mining is performed by preprocessing the data effectively in order to make it suitable for repeated online queries. We store the preprocessed data in such a way that online processing may be done by applying a graph theoretic search algorithm whose complexity is proportional to the size of the output. The result is an online algorithm which is independent of the size of the transactional data and the size of the preprocessed data. The algorithm is almost instantaneous in the size of the output. The algorithm also supports techniques for quickly discovering association rules from large itemsets. The algorithm is capable of finding rules with specific items in the antecedent or consequent. These association rules are presented in a compact form, eliminating redundancy. The use of nonredundant association rules helps significantly in the reduction of irrelevant noise in the data mining process 相似文献
16.
《国际计算机数学杂志》2012,89(1):69-80
Association rule is one of the data mining techniques involved in discovering information that represents the association among data. Data in the database sometimes appear infrequent but highly associated with a specific data. This paper proposes a technique for significant rare data by introducing second support in discovering the association rules of such data. We show that the proposed approach provides better performance as compared to standard association rules techniques. 相似文献
17.
典型关联规则挖掘算法的分析与比较 总被引:3,自引:0,他引:3
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。 相似文献
18.
19.
基于矩阵的增量式关联规则挖掘算法 总被引:1,自引:1,他引:0
关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。 相似文献