首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
数簪挖掘技术是在大量的数据中发现未知知识的数据分析技术,利用数据挖掘技术分析客户数据,发现其中的耀律,从而为商务决策提供依据。本文研究了关联规则的相关分析并应用于网上书店系统,实现客户订单数据的关联规则挖掘。  相似文献   

2.
针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值,将估计值远大于其他节点的分组进行分割,平均到其他分组中,并且对不同分 组中重复的列表元素进行截断,去除冗余数据。实验表明,本文提出的算法能够有效防止并行化的数据倾斜,减少数据冗余,在时间和空间复杂度上要低于以前的并行化FP-Growth算法。  相似文献   

3.
数据挖掘可以利用各种分析工具从海量数据中发现模型和数据间的关系并做出预测。为了解决入侵检测在不降低精度的同时提高检测速度的问题,提高算法的效率,将FP—Growth算法应用于入侵检测系统中,提出对FP—Growth算法改进FP—tree的头表结构并引入关键属性来挖掘原始审计数据中的频繁模式,实验结果表明改进后的算法比传统的关联算法在入侵检测中的应用效果更好。可以看出,将FP—Growth算法应用于入侵检测中是可行的。  相似文献   

4.
孙志强 《微机发展》2006,16(12):233-236
数据挖掘可以利用各种分析工具从海量数据中发现模型和数据间的关系并做出预测。为了解决入侵检测在不降低精度的同时提高检测速度的问题,提高算法的效率,将FP-Growth算法应用于入侵检测系统中,提出对FP-Growth算法改进FP-tree的头表结构并引入关键属性来挖掘原始审计数据中的频繁模式,实验结果表明改进后的算法比传统的关联算法在入侵检测中的应用效果更好。可以看出,将FP-Growth算法应用于入侵检测中是可行的。  相似文献   

5.
数据挖掘技术是在大量的数据中发现未知知识的数据分析技术,利用数据挖掘技术分析客户数据,发现其中的规律,从而为商务决策提供依据.本文研究了关联规则的相关分析并应用于网上书店系统,实现客户订单数据的关联规则挖掘.  相似文献   

6.
陈敏  李徽翡 《计算机工程》2009,35(20):71-72
针对FP-Growth算法面临大规模数据库时空效率不高的问题,提出一种面向计算机集群的并行算法。采用投影方法直接寻找频繁项的条件数据库,将挖掘条件数据库的工作分化成若干独立的子任务,分配到集群中的节点上并行实现,由中央节点汇总结果并输出。结果证明,该算法不仅能够提高计算速度,解决数据库规模过大时内存溢出的情况,且具有良好的延展性。  相似文献   

7.
8.
针对关联规则挖掘的FP-Growth算法存在对海量数据存储时消耗极大内存开销的弊端,提出一种对FP-Growth加入兴趣度的改进算法,然后与Apriori,FP-Growth算法进行比较,改进后的算法极大减少了内存开销,同时提高了系统执行效率。并且提出改进算法与旅游线路规划挖掘结合的理念,以云南旅游业作为旅游规划对象,充分应用旅游网站的大数据,设计一种旅游线路规划的挖掘系统,为旅游企业找出游客最喜欢的旅游线路以及景区之间的关联规则。  相似文献   

9.
Apriori和FP-Growth算法是频繁模式挖掘中的经典算法,由于Apriori存在更多缺陷,因此FP-Growth是单机计算环境下比较高效的算法。然而,对于非并行计算在大数据时代遇到的瓶颈,提出一种基于事务中项间联通权重矩阵的负载平衡并行频繁模式增长算法CWBPFP。算法在Spark框架上实现并行计算,数据分组时利用负载均衡策略,存入分组的数据是相应频繁项的编码。每个工作节点将分组数据中每一个事物中项的联通信息存入一个下三角联通权重矩阵中,使用被约束子树来加快每个工作节点挖掘频繁模式时创建条件FP-tree的速度,再用联通权重矩阵避免每次挖掘分组中频繁模式时对条件模式基的第一次扫描。由于联通权重矩阵和被约束子树的结合应用于每一个工作节点的FP-tree挖掘过程,因此提升了并行挖掘FP-tree性能。通过实验表明,所提出的并行算法对大的数据有较高性能和可扩展性。  相似文献   

10.
运用软件工程的开发原理开发了网上招聘系统,描述了系统的整体结构、用例设计和模块设计。企业工作人员通过这个招聘系统可以统计整理应聘者的简历,并提取出需要面试的人员。提高了企业的工作效率,同时及时招聘到满意的人才  相似文献   

11.
Apriori算法在银行系统数据挖掘中的应用   总被引:2,自引:0,他引:2  
对网上银行系统的数据进行了预处理,完成了关联规则的分析,给出了关联规则数据挖掘过程。根据设定的挖掘目标在Weka平台上采用Apriori算法对银行系统的数据进行了数据挖掘。结果表明,挖掘出的关联规则达到了预定要求,对其他相关领域的数据挖掘有一定的研究价值。  相似文献   

12.
在处理战略绩效KPI关联规则挖掘的问题时,由于FP-Growth不能根据业务的需要简化计算过程,从而产生了许多冗余计算,影响了算法的效率。因此,提出了一种基于FP-Growth的战略绩效关联分析算法。通过采用基于规则的约束方法对FP-Growth算法进行改进。一方面,在挖掘的过程中添加剪枝操作,提高频繁项集的挖掘效率;另一方面,在关联规则产生过程中,添加规则约束,生成符合业务要求的关联规则,从而减少了冗余计算,提高了算法的效率。最后,以"某高校科研服务质量指标"为例,验证了该算法的可行性。  相似文献   

13.
数据挖掘是一项热门技术,该技术融合了数据库、统计学等领域知识,关联规则的挖掘则能找出商品销售中商品之间的联系。本文针对Apriori算法,及其改进算法FP-Growth进行了研究,对比了Apriori算法与FPGrowth算法的效率,得出FP-Growth算法由于只需要对数据进行一次扫描即可生成相应的数据集,使其生成数据集的整体效率要高于Apriori算法。  相似文献   

14.
介绍一种利用ASP开发动态网站的实例,讲述了网上人才招聘系统的总体分析和设计、数据库和程序设计.  相似文献   

15.
针对FP算法的缺陷,将OLAP技术和Apriori关联规则相结合,提出了一种针对FP算法的改进的多层次关联规则数据挖掘算法,在分析了关联规则数据挖掘结构的基础上,给出了该算法的思想与执行步骤,对于关联规则数据挖掘的研究具有一定的理论意义。  相似文献   

16.
探讨了挖掘关联规则的善本算法─Apriori算法以及空间关联规则MMS (Multiple Minimum Support)算法,并探讨了这两种算法在客户关系管理系统中的应用.  相似文献   

17.
随着计算机及网络技术的飞速发展,Internet/Interanet应用的普及和Web技术的发展,信息自动化的作用也越来越大。招聘网站为应聘者提供了方便、快捷的应聘途径。对招聘单位来说,招聘网站也为他们提供了查询、检索应聘者信息库的条件。此系统的开发为应聘者及招聘公司带来了很大的方便,足不出户就可以轻松完成求职和招聘工作。  相似文献   

18.
根据关联规则数据挖掘算法的有关理论,对经典的关联规则挖掘算法Apriori算法进行优缺点分析,并采用新的PS(Power Set)算法对该算法的不足之处进行改进,最后将PS算法应用到汽车零部件故障分析系统中,对缩短故障反馈周期和故障解决时间具有重要的意义。  相似文献   

19.
数据挖掘在电子商务推荐系统中的应用设计   总被引:1,自引:0,他引:1  
姚罡  麦永浩 《办公自动化》2002,(G00):282-286
一提到电子商务,人们首先想到的是网上购物和网上支付等具体问题,其实,电子商务的宗旨是提高效率,降低经营成本和开拓市场,主要精力要放在寻找用户,保留客户,这样设计一个高效,完全自动化的推荐系统,为客户提供个性化的服务就显得尤为重要,本文提出了基于数据挖掘的推荐系统的设计。  相似文献   

20.
针对FP-Growth算法中频繁模式树的遍历低效问题,提出了一种无项头表的频繁模式增长算法。该算法利用递归回溯的方式遍历频繁模式树以求取条件模式基,解决了对同一树路径多次重复遍历的问题。从理论分析和实际挖掘能力两方面,将新算法与FP-Growth算法进行了对比。结果表明,新算法有效减少了条件模式基的搜索开销,使频繁模式挖掘的效率提高了2~5倍,在时间和空间性能上均优于FP-Growth算法。将该算法应用于通信告警关联规则挖掘,较快地挖掘出了关联规则结果,且正确规则的覆盖率达到了83.3%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号