共查询到20条相似文献,搜索用时 125 毫秒
1.
典型关联规则挖掘算法的分析与比较 总被引:3,自引:0,他引:3
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。 相似文献
2.
3.
典型关联规则挖掘算法的分析与比较 总被引:6,自引:0,他引:6
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。 相似文献
4.
一种快速有效的分布式开采多层关联规则的算法 总被引:6,自引:0,他引:6
关联规则(association rules)是数据开采的重要研究内容,建立项目的层次关系可以发现更加有意义的规则,主要研究分布式环境下开采多层关联规则的问题,提出了一种快速有效的MLFDM算法,采用的技术包括分布式编码交易表的有效修剪,侯选集的产生及修剪技术,侯选项集的全局支持数的计算方法等,论述了它的原理,具体实现方法及其几个改进算法,实验结果表明,算法MLFDM是有效的,并对MLFDM算法的几个变种进行了讨论。 相似文献
5.
关联规则的几种开采算法及其比较分析 总被引:14,自引:0,他引:14
关联规则的发现是数据开采的一个重要方面,目前有许多人正致力于关联规则的快速开采集法,本文介绍几种开采大型事务数据库中所有关联规则的算法,并比较它们的效率。 相似文献
6.
关联规则开采的集合算法 总被引:1,自引:0,他引:1
为了有效地从商业数据库中开采出有用的信息,需要解决的两个关键问题:(1)如何将现有的各种开采算法集成到DBMS(数据库管理系统)中去,(2)提高开采的效率,本文以关联规则开采为例,研究了上述问题,为了将关联规则开采算法与DBMS进行无缝集成,我们需要研制面向集合操作的集合算法,STEM是关联规则开采的经共集合算法,我们在分析了STEM算法性能以后提出了改进的SETM算法,为了提高开采的效率我们给出了并行开采算法PSETM*(Parallel SETM*),从算法比较中可以看出SETM*比SETM要高效。 相似文献
7.
关联规则的增量式更新算法 总被引:180,自引:4,他引:180
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incremental updating algorithm)和PIUA(parallel incremental updating algorithm),用来解决这一关联规则高效维护问题. 相似文献
8.
9.
数字属性的优化关联规则开采 总被引:2,自引:0,他引:2
关联规则揭示了关系表中属性之间潜在的联系,优化关联规则是发现特定属性间用户最感兴趣关系的一种有效途径。该文提出了一种基于数字属性的优化关税规则开采算法,该算法允许优化关联规则包含多维析取范式。 相似文献
10.
阐述在数据挖掘领域中的四种常用的数据挖掘技术方法,以数据挖掘技术中的关联规则挖掘为基础,阐述关联规则挖掘的经典算法Apriori算法的基本思想。通过关联规则挖掘算法实验给出该算法的具体使用方法,总结该算法存在的不足。 相似文献
11.
时空轨迹伴随模式是数据挖掘领域的一项重要研究内容。CMC(Coherent Moving Cluster)算法是一种经典的时空轨迹伴随模式挖掘算法,该算法引入了DBSCAN算法以挖掘出任意形状的簇。但是,DBSCAN聚类算法极耗时,导致CMC算法的时间效率较低。因此提出了一种基于网格索引的时空轨迹伴随模式挖掘算法MAP-G(Mining Adjoint Pattern of spatial-temporal trajectory based on the Grid index)。实验表明,MAP-G算法不仅比CMC算法具有更高的时间效率,而且能够过滤掉部分不正确的结果,因此结果也更加准确。 相似文献
12.
数据挖掘在电子商务中发挥着越来越重要的作用。分类是数据挖掘中一项非常重要的任务。由于单独的分类器都具有一定的适用范围,所以将多个分类器的分类结果进行合并形成更高精度的分类结果是很有意义的一种方法。文中提出了一种基于遗传算法将多种分类器进行合并,以提高分类精度,扩大数据挖掘程序应用范围的方法。 相似文献
13.
针对现在全球极端天气频发的现状,天气预报用来及时发现灾害天气的出现显得尤为重要.随着数据挖掘技术的迅速发展和广泛应用,采用了改进FP-growth算法挖掘出各种气象因子之间可能存在的关联,从而发现气象特点,对近期天气气象做出预报.经过仿真实验验证,改进后的算法在天气预报准确率有了明显的提高. 相似文献
14.
聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致差异性度量不够准确。针对这个问题,提出基于结构相似性的k-modes算法。该算法不仅考虑属性值它们本身的异同,而且考虑了它们在其他属性下所处的结构。从集群识别和准确率两个方面进行仿真实验,表明基于结构相似性的k-modes算法在伸缩性和准确率方面更有效。 相似文献
15.
采用权重增量挖掘思想优化算法,为用户推荐个性化产品配置提供了有效的解决方案.方法主要主要分为3个部分,首先利用平台搭建起来的用户跟踪模块对用户行为进行跟踪和数据的收集;然后结合用户最近的行为习惯,使用基于权重增量的Apriori算法进行关联规则挖掘;最后根据挖掘出的结果完成产品推荐的过程.通过对挖掘算法的优化,大大提高了系统的运行效率和准确性,产品推荐随着用户行为的改变而改变,更加符合实际情况.实验结果表明,该算法可以有效解决产品推荐问题,相比于传统关联规则挖掘算法,准确率提高了4%. 相似文献
16.
遗传算法是数据挖掘中一种重要的分类挖掘算法,但简单的遗传算法具有很大的随机性,出错率较高,难以满足数据挖掘的需要。为此,提出一种基于遗传算法和Apriori的分类挖掘算法——GAA。从编码设计、适应度函数、遗传算子的设计方面进行讨论和分析,结合一个具体实例进行应用,结果表明算法在代数较少情况下,可有效提高分类的准确性,具有一定的应用价值。 相似文献
17.
18.
19.
刘英华 《计算机工程与科学》2014,36(7):1384-1388
隐私保护数据挖掘是当前数据挖掘领域中一个十分重要的研究问题,其目标是在无法获得原始明文数据时可以进行精确的数据挖掘,且挖掘的规则和知识与明文数据挖掘的结果相同或类似。为了强化数据的隐私保护、提高挖掘的准确度,针对分布式环境下聚类挖掘隐私保护问题,结合完全同态加密、解密算法,提出并实现了一种基于完全同态加密的分布式隐私保护FHE DBIRCH模型。模型中数据集传输采用完全同态加密算法加密、解密,保证原始数据的隐私。理论分析和实验结果表明,FHE-DBIRCH模型不仅具有很好的数据隐私性且保持了聚类精度。 相似文献
20.
关联分析是一种重要的数据挖掘技术。文中结合房地产行业的特点,将关联分析方法应用于对消费者购房行为的研究中。传统的关联规则挖掘算法-Apriori算法在实际应用中存在着计算量大、挖掘效率低、产生大量不相关的关联规则等问题。为了减少计算量、提高挖掘效率、发现有价值的关联规则,提出了一种灰色关联度分析算法和Apriori算法结合的研究方法。首先采用灰色关联度分析算法得出影响消费者购房需求和偏好的关键因子,然后采用Apriori算法对关键因子和目标因子之间进行关联规则挖掘。以某市问卷调查的消费者信息记录进行建模,结果表明该关联分析方法具有较高的挖掘效率并且研究结果具有合理性和准确性。 相似文献