期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

宋少鹏杨英杰汪永伟《计算机工程》2013,39(3):41-45

数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。相似文献

2.

概念格上无冗余关联规则的提取算法NARG 总被引：2，自引：0，他引：2

下载免费PDF全文

苗茹沈夏炯胡小华《计算机工程》2009,35(22):74-76

在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。相似文献

3.

不完全数据库中关联规则的两种求估方法

王新《计算机应用》2004,24(8):63-65

在关系数据库中，数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法，并进行了简单的比较。相似文献

4.

适合于高效更新的关联规则挖掘算法 总被引：6，自引：0，他引：6

周海岩《小型微型计算机系统》2004,25(4):634-637

实用的关联规则挖掘算法，为了发现事先未知的关联规则，用户需要通过对最小支持度和最小可信度这两个阈值的不断调整来逐步聚焦到那些真正令其感兴趣的关联规则上去，这将是一个动态的交互过程，因此，迫切需要高效的更新算法来满足用户对较快的响应时间的需求，基于这种思想，并深入分析了已有的诸关联规则挖掘与更新算法且指出其共同存在的问题与不足，在此基础上，提出一种当数据库数据不变时，仅扫描数据库一次，即可反复调整最小支持度和最小可信度进行关联规则挖掘与更新的高效、实用的算法，特别在对关联规则进行更新时，该算法对最初和前次挖掘过程中所得到的信息加以充分的利用，从而对关联规则进行更新时算法的执行效率得到进一步的提高，并对算法进行了分析与讨论．相似文献

5.

模糊Horn子句规则挖掘算法研究 总被引：1，自引：0，他引：1

刘东波卢正鼎《计算机科学》2011,38(9):142-145

模糊关联规则可以用自然语言来表达人类知识,受到数据挖掘与知识发现研究人员的广泛关注。但是,目前大多数模糊关联规则挖掘方法仍然基于经典关联规则的支持度和可信度测度。从模糊蕴涵的观点出发,定义了模糊Horn子句规则、支持度、蕴涵强度以及相关概念,提出了模糊Horn子句规则挖掘算法。该算法可以分解为3个步骤。首先,将定量数据库转换为模糊数据库。其次,挖掘模糊数据库中所有支持度不小于指定最小支持度阂值的频繁项目集。一旦得到了所有频繁项目集,就可以用一种直接的方法生成所有蕴涵强度不小于指定最小蕴涵强度阂值的模糊Horn子句规则。相似文献

6.

一种混合型的增量数据关联规则挖掘算法

邓广彪《数字社区&智能家居》2014,(11):7237-7240

在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。相似文献

7.

一种混合型的增量数据关联规则挖掘算法

邓广彪《数字社区&智能家居》2014,(31):7237-7240,7243

在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。相似文献

8.

通过先验知识挖掘更有意义的关联规则 总被引：1，自引：0，他引：1

郝雷王咏盛焕烨《计算机仿真》2005,22(3):99-102

原有的基于后选集的挖掘数据库关联规则的算法视备个项目是“平等”的,筛选出的项目仅仅是在数据库中出现次数较多的。不能体现出实际项目的重要性的差异,而且挖掘出的关联规则即使有较高的支持度和可信度,但用户未必对此很感兴趣。在该文中,通过引入使用者的先验知识,对数据引入了权值,形成了带权的支持度和带权的可信度,并且引入了信息获取度和兴趣度的概念。由于此模型的改进算法充分考虑到项目集的“重要性”的差异,使得尽可能挖掘出用户感兴趣的关联规则。相似文献

9.

新的关联规则的挖掘与更新算法

王伟勤《计算机与数字工程》2007,35(11):24-27

关联规则挖掘已取得了许多有效的算法,但是当事物数据库发生动态变化时,或数据库保持不变,而最小支持度和最小可信度发生变化时,关联规则的高效更新仍然是个复杂的问题.给出一种新的关联规则的挖掘算法.新的算法只需扫描数据库D一次,减少了I/O次数,为关联规则的更新打下很好的基础. 相似文献

10.

基于兴趣度的关联规则挖掘

李伟东倪志伟刘晓《计算机技术与发展》2007,17(6):80-82,86

关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。相似文献

11.

基于相似关系的数据库分类不一致程度评价

张伟钢潘泉张洪才《计算机学报》2008,31(1):91-103

作为挖掘算法选择和评价的标准之一,数据集的分类不一致程度一直是分类规则研究中的一项重要内容.然而随着人们对不完备数据集数据挖掘的深入,建立在等价关系上的基于信息熵的评价方法已难以满足实际需要.文中在利用相似关系的基础上,结合证据理论,给出一种基于信任度与似然度的信息粒构建方法,同时构建了类似于不协调度和混淆度的系统分类不一致程度评价方法,并对其相关性质等进行分析与证明.由算例分析可以看出,文中研究结果能够较好地描述缺失环境下的系统分类不一致程度,同时当数据集不存在缺失时,该研究与以往研究具有相同结果. 相似文献

12.

关联挖掘中的时效度研究 总被引：1，自引：0，他引：1

王晓国黄韶坤朱炜《计算机应用》2005,25(1):28-30

传统的关联挖掘算法,以支持度和置信度作为评价标准来衡量规则是否有价值。然而,这种模式不能体现出数据的时效敏感特性,如Web数据和长期积累数据。文中将首次建立一个全新的时基模型来重新估计数据规则的价值,并给出时效度(time validity)作为新的规则价值衡量标准。最后,给出了基于这个新的时基模型的一种新并行算法。这种算法使得我们在挖掘过程中使用增量挖掘,而且使得用户可以通过互操作来优化挖掘过程。相似文献

13.

高效中药关联规则发现算法研究及应用 总被引：1，自引：0，他引：1

下载免费PDF全文

王成良吴艳娟《计算机工程与应用》2010,46(34):119-122

将关联规则发现算法引入到中药配方数据库的数据挖掘中,以求发现方剂中单方之间的关联规则及中药中的药对药组,可以为中药中新药的研制提供重要依据。由于常用的关联规则发现算法：Apriori算法存在多次扫描数据库的缺陷,提出了一种基于矩阵的关联规则发现算法：Apriori_Matrix算法,该算法优化了Apriori算法中集合连接过程多次比较所花费的时间,可极大地提高关联规则挖掘的效率。针对中药数据库中单方的种类有限、配伍规则各不相同、同一种病症对应多种方剂的情况,改进算法有助于缩短新药研制的周期。相似文献

14.

Discovering patterns of missing data in survey databases: An application of rough sets

Hai Wang Shouhong Wang 《Expert systems with applications》2009,36(3):6256-6260

Databases for data mining often have missing values. Missing data are often mistreated in data mining and valuable knowledge related to missing data is often overlooked. This study discusses patterns of missing data in survey databases. It proposes a framework of rough set rule induction method that enables the data miner to obtain association rules of patterns of missing data in a survey database. Through an experiment on a real-world data set, we demonstrate the approach to discovering knowledge about missing data. 相似文献

15.

A new approach to online generation of association rules 总被引：6，自引：0，他引：6

Aggarwal C.C. Yu P.S. 《Knowledge and Data Engineering, IEEE Transactions on》2001,13(4):527-540

We discuss the problem of online mining of association rules in a large database of sales transactions. The online mining is performed by preprocessing the data effectively in order to make it suitable for repeated online queries. We store the preprocessed data in such a way that online processing may be done by applying a graph theoretic search algorithm whose complexity is proportional to the size of the output. The result is an online algorithm which is independent of the size of the transactional data and the size of the preprocessed data. The algorithm is almost instantaneous in the size of the output. The algorithm also supports techniques for quickly discovering association rules from large itemsets. The algorithm is capable of finding rules with specific items in the antecedent or consequent. These association rules are presented in a compact form, eliminating redundancy. The use of nonredundant association rules helps significantly in the reduction of irrelevant noise in the data mining process 相似文献

16.

Association rules on significant rare data using second support

《国际计算机数学杂志》2012,89(1):69-80

Association rule is one of the data mining techniques involved in discovering information that represents the association among data. Data in the database sometimes appear infrequent but highly associated with a specific data. This paper proposes a technique for significant rare data by introducing second support in discovering the association rules of such data. We show that the proposed approach provides better performance as compared to standard association rules techniques. 相似文献

17.

典型关联规则挖掘算法的分析与比较 总被引：3，自引：0，他引：3

冯洁陶宏才《微机发展》2007,17(3):121-124

关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。相似文献

18.

基于中药专利数据集的关联规则发现算法*

钱增瑾辛燕鞠时光《计算机应用研究》2007,24(7):61-63

指出关联规则在中药数据分析中的难点,据此提出了一种改进的Apriori算法--Apriori 算法;最后,以治疗感冒的中药专利数据集为测试数据,进一步验证算法的有效性和实用性.结果表明,此算法能够有效地从治疗感冒的专利数据库中发现布尔型与数值型关联规则,为开发新的感冒中药提供配伍依据. 相似文献

19.

基于矩阵的增量式关联规则挖掘算法 总被引：1，自引：1，他引：0

倪志伟高雅卓李伟东束建华《计算机工程与应用》2008,44(13):153-155

关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。相似文献