首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 145 毫秒
1.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

2.
王新 《计算机应用》2004,24(8):63-65
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。  相似文献   

3.
适合于高效更新的关联规则挖掘算法   总被引:6,自引:0,他引:6  
实用的关联规则挖掘算法,为了发现事先未知的关联规则,用户需要通过对最小支持度和最小可信度这两个阈值的不断调整来逐步聚焦到那些真正令其感兴趣的关联规则上去,这将是一个动态的交互过程,因此,迫切需要高效的更新算法来满足用户对较快的响应时间的需求,基于这种思想,并深入分析了已有的诸关联规则挖掘与更新算法且指出其共同存在的问题与不足,在此基础上,提出一种当数据库数据不变时,仅扫描数据库一次,即可反复调整最小支持度和最小可信度进行关联规则挖掘与更新的高效、实用的算法,特别在对关联规则进行更新时,该算法对最初和前次挖掘过程中所得到的信息加以充分的利用,从而对关联规则进行更新时算法的执行效率得到进一步的提高,并对算法进行了分析与讨论.  相似文献   

4.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

5.
通过先验知识挖掘更有意义的关联规则   总被引:1,自引:0,他引:1  
郝雷  王咏  盛焕烨 《计算机仿真》2005,22(3):99-102
原有的基于后选集的挖掘数据库关联规则的算法视备个项目是“平等”的,筛选出的项目仅仅是在数据库中出现次数较多的。不能体现出实际项目的重要性的差异,而且挖掘出的关联规则即使有较高的支持度和可信度,但用户未必对此很感兴趣。在该文中,通过引入使用者的先验知识,对数据引入了权值,形成了带权的支持度和带权的可信度,并且引入了信息获取度和兴趣度的概念。由于此模型的改进算法充分考虑到项目集的“重要性”的差异,使得尽可能挖掘出用户感兴趣的关联规则。  相似文献   

6.
模糊Horn子句规则挖掘算法研究   总被引:1,自引:0,他引:1  
模糊关联规则可以用自然语言来表达人类知识,受到数据挖掘与知识发现研究人员的广泛关注。但是,目前大多数模糊关联规则挖掘方法仍然基于经典关联规则的支持度和可信度测度。从模糊蕴涵的观点出发,定义了模糊Horn子句规则、支持度、蕴涵强度以及相关概念,提出了模糊Horn子句规则挖掘算法。该算法可以分解为3个步骤。首先,将定量数据库转换为模糊数据库。其次,挖掘模糊数据库中所有支持度不小于指定最小支持度阂值的频繁项目集。一旦得到了所有频繁项目集,就可以用一种直接的方法生成所有蕴涵强度不小于指定最小蕴涵强度阂值的模糊Horn子句规则。  相似文献   

7.
邓广彪 《数字社区&智能家居》2014,(31):7237-7240,7243
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

8.
一直以来,关联规则挖掘算法主要基于支持度-可信度构架,但这样的算法有一个固有的缺陷,不能对非频繁项进行研究,而在许多实际应用中,如相似Web文档的识别。灾害预防,往往需要对高度关联的项集进行分析,即使它不是频繁出现的,放弃支持度,只使用可信度的关联规则挖掘算法将有利于这一问题的解决,这是一个新的研究方向。在对传统的关联规则挖掘算法进行了简单介绍后,主要介绍了基于可信度构架的关联规则挖掘算法,并对它们进行了分析与评价。  相似文献   

9.
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

10.
关联规则挖掘已取得了许多有效的算法,但是当事物数据库发生动态变化时,或数据库保持不变,而最小支持度和最小可信度发生变化时,关联规则的高效更新仍然是个复杂的问题.给出一种新的关联规则的挖掘算法.新的算法只需扫描数据库D一次,减少了I/O次数,为关联规则的更新打下很好的基础.  相似文献   

11.
作为挖掘算法选择和评价的标准之一,数据集的分类不一致程度一直是分类规则研究中的一项重要内容.然而随着人们对不完备数据集数据挖掘的深入,建立在等价关系上的基于信息熵的评价方法已难以满足实际需要.文中在利用相似关系的基础上,结合证据理论,给出一种基于信任度与似然度的信息粒构建方法,同时构建了类似于不协调度和混淆度的系统分类不一致程度评价方法,并对其相关性质等进行分析与证明.由算例分析可以看出,文中研究结果能够较好地描述缺失环境下的系统分类不一致程度,同时当数据集不存在缺失时,该研究与以往研究具有相同结果.  相似文献   

12.
关联挖掘中的时效度研究   总被引:1,自引:0,他引:1  
传统的关联挖掘算法,以支持度和置信度作为评价标准来衡量规则是否有价值。然而,这种模式不能体现出数据的时效敏感特性,如Web数据和长期积累数据。文中将首次建立一个全新的时基模型来重新估计数据规则的价值,并给出时效度(time validity)作为新的规则价值衡量标准。最后,给出了基于这个新的时基模型的一种新并行算法。这种算法使得我们在挖掘过程中使用增量挖掘,而且使得用户可以通过互操作来优化挖掘过程。  相似文献   

13.
高效中药关联规则发现算法研究及应用   总被引:1,自引:0,他引:1       下载免费PDF全文
将关联规则发现算法引入到中药配方数据库的数据挖掘中,以求发现方剂中单方之间的关联规则及中药中的药对药组,可以为中药中新药的研制提供重要依据。由于常用的关联规则发现算法:Apriori算法存在多次扫描数据库的缺陷,提出了一种基于矩阵的关联规则发现算法:Apriori_Matrix算法,该算法优化了Apriori算法中集合连接过程多次比较所花费的时间,可极大地提高关联规则挖掘的效率。针对中药数据库中单方的种类有限、配伍规则各不相同、同一种病症对应多种方剂的情况,改进算法有助于缩短新药研制的周期。  相似文献   

14.
Databases for data mining often have missing values. Missing data are often mistreated in data mining and valuable knowledge related to missing data is often overlooked. This study discusses patterns of missing data in survey databases. It proposes a framework of rough set rule induction method that enables the data miner to obtain association rules of patterns of missing data in a survey database. Through an experiment on a real-world data set, we demonstrate the approach to discovering knowledge about missing data.  相似文献   

15.
A new approach to online generation of association rules   总被引:6,自引:0,他引:6  
We discuss the problem of online mining of association rules in a large database of sales transactions. The online mining is performed by preprocessing the data effectively in order to make it suitable for repeated online queries. We store the preprocessed data in such a way that online processing may be done by applying a graph theoretic search algorithm whose complexity is proportional to the size of the output. The result is an online algorithm which is independent of the size of the transactional data and the size of the preprocessed data. The algorithm is almost instantaneous in the size of the output. The algorithm also supports techniques for quickly discovering association rules from large itemsets. The algorithm is capable of finding rules with specific items in the antecedent or consequent. These association rules are presented in a compact form, eliminating redundancy. The use of nonredundant association rules helps significantly in the reduction of irrelevant noise in the data mining process  相似文献   

16.
Association rule is one of the data mining techniques involved in discovering information that represents the association among data. Data in the database sometimes appear infrequent but highly associated with a specific data. This paper proposes a technique for significant rare data by introducing second support in discovering the association rules of such data. We show that the proposed approach provides better performance as compared to standard association rules techniques.  相似文献   

17.
典型关联规则挖掘算法的分析与比较   总被引:3,自引:0,他引:3  
冯洁  陶宏才 《微机发展》2007,17(3):121-124
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。  相似文献   

18.
指出关联规则在中药数据分析中的难点,据此提出了一种改进的Apriori算法--Apriori 算法;最后,以治疗感冒的中药专利数据集为测试数据,进一步验证算法的有效性和实用性.结果表明,此算法能够有效地从治疗感冒的专利数据库中发现布尔型与数值型关联规则,为开发新的感冒中药提供配伍依据.  相似文献   

19.
基于矩阵的增量式关联规则挖掘算法   总被引:1,自引:1,他引:0       下载免费PDF全文
关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号