首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在个性化的网络学习中,对知识点间的关联规则进行挖掘是一个关键的问题.该文提出了一种基于后缀树的知识点间关联规则挖掘算法,该算法通过对web日志数据构造后缀树进行序列挖掘,动态地挖掘最大频繁序列,进而发现有意义的知识点间的关联规则.  相似文献   

2.
高效关联规则数据挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘领域的一个重要问题,由于关联规则挖掘通常是基于超大型数据库或数据仓库,算法的效率在一定程度上决定挖掘的成败,针对关联规则挖掘中的主要任务--频集发现过程中存在的几个问题,提出了项目树的概念,引出了一种新的控制模式,并设计了相应的高效挖掘算法,大大提高了挖掘效率。  相似文献   

3.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

4.
项集间关联规则的挖掘   总被引:1,自引:1,他引:0  
本文介绍了如何从大量篮数据类型交易中挖掘具有确定的最小可信度的商品(项)集之间的关联规则,并给出一个有效的挖掘算法。  相似文献   

5.
关联规则挖掘是数据挖掘领域的重要技术.在分析关联规则和广义关联规则的基本模型的基础上,提出了关系数据库中多项集关联规则的基本模型,对多项集关联规则挖掘方法进行了探讨.  相似文献   

6.
敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用FP-tree存储了与事务数据库相关的全部信息,减少了产生和测试候选集耗费的大量时间;再利用改进的频繁模式树(IFP-tree)是单向的,快速挖掘出最大频繁项目集,确定敏感性关联规则;然后删除敏感关联规则对应的频繁项目集,更新IFP-tree项目集节点和相应的项目头表的计数,对更新的IFP-tree反向挖掘生成新的不包含敏感关联规则的事务数据库.实例和理论分析表明,该方法是正确和高效的.  相似文献   

7.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

8.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进.  相似文献   

9.
中药复方组成规律的关联规则发现系统   总被引:4,自引:0,他引:4  
主要讨论如何将知识挖掘中的关联规则发现算法应用于传统中药复方数据库,以求发现中药单方之间的配伍规律、为了实现高效的关联规则发现以及提高系统的灵活性,系统采用了基于数据立方体的关联规则发现方法,其目标数据是包含了2500条中药复方信息的数据库.系统能够根据用户的设定,从数据库中发现治疗某一特定疾病的所有复方中不同单方之间的关联规则.  相似文献   

10.
给出了一种高效的大数据库中挖掘关联规则的算法,该算法通过精心安排挖掘过程中的数据结构,以减少对数据库的扫描遍数,大大地提高了算法的执行效率。  相似文献   

11.
To detect the DoS in networks by applying association rules mining techniques, we propose that association rules and frequent itemsets can be employed to find DoS pattern in packet streams which describe traffic and user behaviors. The method extracts information from the log analysis of submitted packets using the algo- rithm which depends on the definition of the intrusion. Large itemsets were extracted to represent the super facts to build the association analysis for the intrusion. Network data files were analysed for experiments. The analysis and experimental results are encouraging with better performance as packet frequency number increases.  相似文献   

12.
给出了一种高效的大数据库中挖掘关联规则的算法 ,该算法通过精心安排挖掘过程中的数据存贮结构 ,以减少对数据库的扫描遍数 ,大大地提高了算法的执行效率。  相似文献   

13.
14.
提出了分布式数据库中存在分段复制的情况下联系规则的挖掘方法,该方法采用局部候选集删减,有效地减少了大项目集的候选集,采用投票站点有效地减少了站点间的通信量  相似文献   

15.
Based on the rough set theory which is a powerful tool in dealing with vagueness and uncertainty, an algorithm to mine association rules in incomplete information systems was presented and the support and confidence were redefined. The algorithm can mine the association rules with decision attributes directly without processing missing values. Using the incomplete dataset Mushroom from UCI machine learning repository, the new algorithm was compared with the classical association rules mining algorithm based on Apriori from the number of rules extracted, testing accuracy and. execution time. The experiment results show that the new algorithm has advantages of short execution time and high accuracy.  相似文献   

16.
针对传统研究大多基于影响个体挖掘而忽略了影响群落的发现,本文考虑用户之间的频繁传播模式,提出了一种基于频繁传播模式的影响群落挖掘方法。针对群落内部传播模式的多样化,给出了一种信息传播树扩展方法,通过松弛信息传播树有向特性与图扩展方法,将信息传播树转换为连通无向无环图。结合支持度与影响强度,提出了一种新的频繁子图挖掘算法Tribe-FGM,减小模式增长的规模,提高频繁子图挖掘效率。实验采用新浪微博真实数据,在约90万条博文以及对应约64万左右用户的"地震"话题与约31万条博文以及对应约21万左右用户的"两会"话题的数据集上验证了算法的性能和有效性。  相似文献   

17.
The traditional generalization-based knowledge discovery method is introduced. A new kind of muhilevel spatial association of the rules mining method based on the cloud model is presented. The cloud model integrates the vague and random use of linguistic terms in a unified way. With these models, spatial and nonspatial attribute values are well generalized at multiple levels, allowing discovery of strong spatial association rules.Combining the cloud model based method with Apriori algorithms for mining association rules from a spatial database shows benefits in being effective and flexible.  相似文献   

18.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

19.
挖掘区间值关系数据库的模糊关联规则   总被引:3,自引:0,他引:3  
应用关系数据的模糊C-均值算法把数量型属性划分成若干个模糊集,提出挖掘区间值关系数据库数量型属性模糊关联规则的算法,在关系数据的模糊C-均值算法与部分聚集算法的基础上提出一种新的模糊聚类算法-关系数据的竞争聚集算法,并用它来划分数量型属性,由于关系数据的竞争聚集算法能得到优化的固定的聚类个数,因此能挖掘出优化的模糊关联规则。  相似文献   

20.
基于概念层次的关联规则挖掘算法   总被引:4,自引:0,他引:4  
在经典关联规则挖掘算法的基础上,给出了带有概念层次的事务数据的关联规则有效挖掘算法,并通过实验,给出算法执行效率的分析。结果表明,该算法能得到有效的基于概念层次的关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号