期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李重周杨君锐《重庆理工大学学报(自然科学版)》2007,21(6):122-124

在对Apriori算法的特性进行详细的介绍和总结的基础上,提出一种新的不产生候选项集的,以及只进行少量数据库扫描的挖掘频繁项集的算法SI-tree(Supper-Item Tree),该算法通过搜索数据库和一次性地找出当前项的所有超集来查找频繁项集.最后通过实验对2种算法进行了比较. 相似文献

2.

关联规则算法的电信网络告警应用

于漫胡明金刚胡亮赵阔《长春邮电学院学报》2010,(3):264-269

为提高网络告警数据的处理效率,迅速找出故障根源,以保证整个电信网络的正常运行。针对告警数据的特点对传统的关联规则算法进行了相应的改进,提供了优先剪枝策略,避免了生成没有意义的频繁项集;k-1-项集通过连接操作生成k项集,避免了反复扫描数据库所带来的压力。结果表明,改进算法提高了挖掘效率,达到快速诊断网络故障的目的。相似文献

3.

一种不产生候选项集的关联规则挖掘算法

李重周杨君锐《重庆理工大学学报(自然科学版)》2007,21(11):122-124

在对Apriori算法的特性进行详细的介绍和总结的基础上，提出一种新的不产生候选项集的，以及只进行少量数据库扫描的挖掘频繁项集的算法SI_ree（Supper-Item Tree），该算法通过搜索数据库和一次性地找出当前项的所有超集来查找频繁项集．最后通过实验对2种算法进行了比较．相似文献

4.

关联规则挖掘中最大频繁集的双向查找算法 总被引：5，自引：0，他引：5

宋雨赵建利王保义《华北电力大学学报(自然科学版)》2005,32(2):67-70

在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。相似文献

5.

基于图的频繁项集挖掘

刘丽《湖南城建高等专科学校学报》2009,(3):68-70

通过对Apriori算法的频繁项目集的分析研究,给出了基于图的频繁项集挖掘算法．该算法在求频繁K-项集的过程中只需一次扫描数据库,避免了Apriori算法需多次扫描数据库的不足。同时,由于在有向图中利用有限节点之间的路径求频繁K-项集,该算法减少了Apriori算法中需多次进行连接运算的不足。相似文献

6.

一种基于倒排索引的频繁项集挖掘方法

贾丽波姜晓明叶青陈占芳《长春理工大学学报(自然科学版)》2019,42(2)

针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。相似文献

7.

分布式数据库全局最大频繁项集增量更新算法

何波闫河《四川大学学报(工程科学版)》2012,44(3):112-117

随着分布式数据库记录的不断增加,需要对已挖掘出的全局最大频繁项集进行增量更新。在已经提出的快速挖掘全局最大频繁项集算法(FMMFI)的基础上,提出了分布式数据库全局最大频繁项集增量更新算法(IUGMFI)。IUGMFI算法利用了FMMFI算法已经挖掘出的分布式数据库全局频繁项目和全局最大频繁项集。挖掘增量数据库的全局频繁项目,构建增量数据库的FP-tree,挖掘出增量数据库的全局最大频繁项集,采用自上而下的剪枝策略更新全局最大频繁项集。理论分析和实验结果表明,IUGMFI算法是快速而有效的。相似文献

8.

一种改进的Apriori算法

赵军民张向娟高蔚《平顶山工学院学报》2010,(6)

Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。相似文献

9.

一种改进的基于关联图的关联规则挖掘算法

罗楠李玉忱《山东大学学报(工学版)》2004,34(1):99-103

关联规则是数据挖掘研究的一个重要课题 ,而最大频繁项集的生成是影响关联规则挖掘的关键问题 .在已有的频繁集发现算法中 ,DLG算法通过减少事务数据库的扫描次数 ,进而有效减少挖掘过程的I/O代价 .在阐述DLG算法的实现原理与执行过程的基础上 ,为进一步减少候选项集的数量 ,提出一种改进算法DLG .其主要思想是在关联图构造阶段 ,统计每一个频繁项目的入度 ,以此作为剪枝的依据 .性能分析和比较试验的结果表明该算法性能优良相似文献

10.

提高Eclat算法效率的策略

冯培恩刘屿邱清盈李立新《浙江大学学报(工学版)》2013,47(2):223-230

为了提高Eclat算法的效率,从剪枝、项集连接和交叉计数3方面对Eclat算法进行优化.将后缀相同的项集归为一个等价类,使剪枝更充分,剪枝时引入双层哈希表加快搜索候选项集子集的速度;提出项集集合划分链表,以减少项集连接过程中比较判断的环节;提出事务标识（Tid）失去阈值,以加快交叉计数的速度.在此基础上提出一种优化的Eclat_opt算法(ZAKI),把它与Eclat原算法以及其他2种Eclat改进算法Diffset (ZAKI), hEclat(熊忠阳）进行对比实验的结果表明,Eclat_opt算法的效率在稀疏数据集上最高,总体时间性能最好. 相似文献

11.

一种改进的AprioriTid优化算法

梅东霞张晓明《北京石油化工学院学报》2007,15(2):14-16

提出了一种易于改进的AprioriTid优化算法,它的特点是:一项频繁集和二项频繁集用经典Apriori算法实现,三项及其以上频繁集采用AprioriTid优化算法的思想,即项目集采用关键字识别来统计支持度.实验结果表明,算法易于实现,比AprioriTid优化算法有更好的性能. 相似文献

12.

基于关联规则算法的医疗数据挖掘

胡瑞娟李岩芳何昀《长春理工大学学报(自然科学版)》2009,32(2):282-284

通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性. 相似文献

13.

一种Apriori算法的改进 总被引：1，自引：1，他引：0

周兴斌迟殿委《南昌大学学报(工科版)》2008,30(2):1

Apriori算法是关联规则的经典算法。从两个方面对其进行了改进,首先是在产生候选项集时采用了新的算法,更快地产生候选项集;其次,该算法采用了一种新的数据结构——索引结构来存储事务项集数据,提高了读取数据库中有效数据的速率,同时减少了一些不必要的数据扫描,利于更快地产相似文献

14.

Mining association rule efficiently based on data warehouse

CHEN Xiao-hong 《中南工业大学学报(英文版)》2003,10(4):375-380

1　INTRODUCTIONDatamining (DM )istheprocessofextractingvaluableknowledgehiddeninlargevolumesofrawda ta[1 15] .Aneffectivedataminingmethodshoulden abletheuserstoexplorethedatawarehouse ,selectallkindsofrelativedata ,conductanalysisatdifferentlevelsandfinally publishknowledgeinvariousfor mats.However ,theabundanceofthedatainthedatawarehouse(DW )canalsoaffecttheefficiencyofDM ,thereasonofwhichliesinthefollowingaspects[2 4 ] :1)agreatnumberofdataoftenresultinmultiplescanintheDWandtherefor… 相似文献

15.

Apriori算法的改进 总被引：2，自引：0，他引：2

赵松孙立镌《哈尔滨理工大学学报》2007,12(5):94-97

针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率. 相似文献

16.

基于Apriori数据挖掘算法研究 总被引：3，自引：0，他引：3

郭秀娟张树彬岳俊华《吉林建筑工程学院学报》2010,27(3):57-60

关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高. 相似文献

17.

一种基于MapReduce的Apriori改进算法研究

张艺雪黄毅杰《兰州工业高等专科学校学报》2014,(6):13-16

提出了一种基于MapReduce模型,利用向量矩阵和Apriori算法实现关联规则数据挖掘的新算法.算法利用MapReduce模型处理向量矩阵,结合Apriori算法思想,产生局部频繁项集,通过合并处理得到全局频繁项集.实验证明算法能提高关联规则挖掘的效率. 相似文献

18.

基于数据库垂直表示的高效用项集挖掘算法研究

宋威刘宇李晋宏《北方工业大学学报》2011,23(1):20-24

传统的频繁项集挖掘用支持度来衡量项集的重要性会丢失一些支持度不高,但效用很高、用户很可能感兴趣的模式.高效用项集能反映用户的偏好,弥补传统频繁项集挖掘的不足.本文提出了一种基于数据库垂直表示的高效用项集挖掘算法,通过执行事务支持集的交运算来找寻候选高效用项集,通过扫描一遍数据库,从候选高效用项集中发现高效用项集.本算法利用了数据库垂直表示方法存储量小、运算快的优势.实验结果表明,该算法具有较高的挖掘效率和良好的可扩展性. 相似文献