首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对目前很少有一整套的能同时处理量化属性和分类属性字段的多维关联规则的解决方法,提出了一整套的从原数据出发一直到关联规则的可视化的解决方法,论文首先采用了等深分箱的方法将量化属性按引进的最大支持度进行离算化处理。在得到频繁集的时候通过对传统的单维.Apriori算法的改进,从而实现了其在多维关联规则中的应用,最后对关联规则的可视化采用了柱状图的方式。  相似文献   

2.
一种挖掘多维关联规则的有效算法   总被引:4,自引:0,他引:4  
1.引言挖掘大型事务数据库中的关联规则是数据挖掘研究的重要课题之一。由于关联规则在商务分析与决策、相关分析、分类等方面具有广泛应用,自提出以来一直受到广泛重视。一维关联规则的挖掘已有不少有效算法(如文,[2,3,4],综述参见文[l])。多维关联规则不仅考虑项集间的关联,而且考虑项集的维约束。这使得挖掘出的规则更具实用性,同时也增加了规则挖掘的难度。基于规则模板的挖掘,使用元规则限定挖掘的关联规则形式,降低了挖掘难度,但也使得其应用受到一定限制。采用类Apriori算法的方法通过求频繁谓词集得到多维关联规则,具有很好的可扩展性,能够处理大量数据,但其处理维谓词的1/O开销较大。利  相似文献   

3.
传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。  相似文献   

4.
5.
介绍关联规则的基本概念及Apriori算法.实现一种基于Apriori算法挖掘多维关联规则的算法,提出将关联规则技术应用于高校学生培养中的学生培养模型,并进行求解。实验结果可以为高校制订相应的人才培养方案提供辅助决策信息。  相似文献   

6.
关联规则Apriori算法   总被引:1,自引:0,他引:1  
阐述了关联规则的基本概念、Apriori算法及其实验结果分析,并描述了Apriori算法的性能瓶颈与改进策略。  相似文献   

7.
基于关联规则的数据挖掘技术的快速算法   总被引:11,自引:1,他引:11  
周剑雄  王明哲 《计算机工程》2003,29(12):48-49,92
提出了一种改进的Apriori算法的数据挖掘模式,探讨了对其中的生成候选频繁项目集、生成强关联规则等几个关健步骤运用标准SQL语言的算法实现。  相似文献   

8.
遥感图像多维量化关联规则挖掘   总被引:13,自引:0,他引:13  
数据与数据库的爆炸式增长引发了一个十分突出的问题,就是如何高效、智能地将海量的数据转化为有用的信息和知识?近年来,数据挖掘技术的广泛研究正是基于这个目的。初步研究了卫星遥感数据的关联规则挖掘及其在土壤侵蚀和退耕还林上的应用。根据多维空间数据的特点,将遥感数据的属性值划分为不同的块。同时为了充分利用现有的关联规则挖掘的算法,还将划分好的数据转变为事务数据库形式。最后,利用Apriori算法提取了土壤侵蚀强度与坡度、植被覆盖度以及坡耕地之间有意义的关联,为退耕还林还草决策提供有益的支持。  相似文献   

9.
基于关联规则的搜索引擎方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的搜索引擎关键词提取算法在实现检索时存在的局限性,在本体推理的基础上,运用基于Apriori算法的关联规则推理过滤,实现对无用词项的过滤和有用信息的提取。实验表明,基于关联规则的Apriori算法,在无用词项过滤和有用信息提取方面,与传统的搜索引擎关键词提取算法相比,具有较好的查全率和效率。  相似文献   

10.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,这些重要信息是关于这些数据的整体特征描述以及对其发展趋势的预测,对决策的制定有着重要的参考价值。主要介绍了数据挖掘和关联规则挖掘的概念,并对数据挖掘经典算法Apriori的进行了分析与改进,算法的改进可以有效地减少对数据库的扫描次数,使挖掘的效率更好更快。  相似文献   

11.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

12.
基于粗糙集的多维关联规则挖掘方法   总被引:1,自引:0,他引:1  
海量的数据使得关联规则挖掘非常耗时,而并非所有的规则都是用户感兴趣的,应用传统的挖掘方法会挖掘出许多无关信息。此外,目前大部分算法是针对单维规则的。因此,定义了一种挖掘语言使得用户可以指定感兴趣的项以及关联规则的参数(如支持度,置信度等),并提出一种基于粗糙集理论的多维关联规则挖掘方法,动态生成频繁集和多维关联规则,减少频繁项集的生成搜索空间。实例分析验证该算法的可行性与有效性。  相似文献   

13.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

14.
关联规则分析在电信交叉销售中的应用研究   总被引:3,自引:0,他引:3  
在阐述电信运营企业市场竞争和营销活动中存在的问题的基础上,结合电信企业的特点,分析了在该行业营销领域采用交叉销售策略的必要性,并将数据挖掘中的关联规则分析法应用于交叉销售分析中.详细介绍了关联规则分析法中的Apriori算法原理,并用该算法对电信业务数据进行了分析,给出了业务之间的关联,为企业实施交叉销售提供了有力的数据支持.  相似文献   

15.
关联规则反映了大量数据中项集间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法,目前已有很多的改进版本,但大多存在多次扫描数据库,项集生成瓶颈和模式匹配频繁的问题,算法效率比较低。本文深入的分析研究关联规则Apriori算法,改进候选频繁项目集的连接和剪枝策略,改进对事务的处理方式,减少模式匹配所需的时间开销,并给出了改进算法。  相似文献   

16.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

17.
基于布尔矩阵的关联规则算法研究*   总被引:2,自引:1,他引:1  
针对可快速在大型交易事务数据库中挖掘关联规则的问题,基于布尔矩阵提出一种新的挖掘算法。该算法通过仅需存储布尔位节约了内存,通过简单布尔运算提高了求解频繁项集的效率。实验证明该算法较之于Apriori 算法有更好的性能。  相似文献   

18.
为了提高经典关联规则Apriori算法的挖掘效率,针对Apriori算法的瓶颈问题,提出了一种链式结构存储频繁项目集并生成最大频繁项目集的关联规则算法.该算法采用比特向量方式存储事务,生成频繁项目集的同时,把包含此频繁项目的事务作为链表连接到频繁项目之后,生成最大频繁项目集.该算法能够减小扫描事物数据库的次数和生成候选项目集的数量,从而减少了生成最大频繁项目集的时间,实验结果表明,该算法提高了运算效率.  相似文献   

19.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

20.
基于PC-树的关联规则挖掘方法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘的一种常用方法,特别是用在货篮分析中,而关联规则的经典算法Apriori及其改进算法的时间复杂度和空间复杂度都比较高,对于数据库更新、用户定义最小支持度等动态数据挖掘的成本太高。针对这种情况,提出了用PC-树寻找频繁项集的算法,实现高效的动态数据挖掘。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号