首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
关联规则挖掘在数据挖掘中占有极其重要的地位,Apriori算法和FP-growth算法是当前关联规则中两大主要频繁项集发现算法.研究了这两种算法的基本思想,指出了算法各自的优缺点并通过具体的实例说明发现频繁项集的方法,最后通过实验对算法进行了性能上的比较.  相似文献   

2.
关联规则技术是数据挖掘的最重要的组成部分之一,它用于发现大量数据中项集之间的有意义的关联和相关联系。本文介绍了使用关联规则挖掘算法FP-growth分析学生选课数据的方法。  相似文献   

3.
针对现在全球极端天气频发的现状,天气预报用来及时发现灾害天气的出现显得尤为重要.随着数据挖掘技术的迅速发展和广泛应用,采用了改进FP-growth算法挖掘出各种气象因子之间可能存在的关联,从而发现气象特点,对近期天气气象做出预报.经过仿真实验验证,改进后的算法在天气预报准确率有了明显的提高.  相似文献   

4.
基于XML数据的FP-growth算法挖掘研究   总被引:1,自引:0,他引:1  
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。  相似文献   

5.
单节点运行的传统SON算法能够有效降低CPU和I/O负载,而且算法仅需要对整个事务数据集扫描两次。但是在算法执行的阶段一中发现局部频繁项集时采用的Apriori算法仍然需要对每个分区进行多次扫描。在深入研究SON算法的基础上,根据MapReduce编程模型提出了基于FPgrowth的SON算法的并行化实现。实验结果表明,基于FP-growth的并行SON算法不仅降低了传统SON算法的运行时间,并且随着分区数目的增加还能获取比较好的加速比。  相似文献   

6.
常规高维混合属性数据挖掘方法多采用云平台技术,无法完整保留数据的结构相似性,使得数据挖掘效率较低。为此,提出了基于FP-growth算法的高维混合属性数据挖掘方法。为了改善数据质量,根据高维混合属性数据在数据库中的存储结构,采用了一种固定算法实现数据去噪,并依据数据类型计算分类型和数值型相似度,结合FP-growth算法对频繁项样本分支进行筛选生成项表头,保证数据结构相似性的完整性,通过搜索项表头输出有效关联规则,实现数据挖掘过程。实验结果表明,所提方法具有较高的挖掘效率。  相似文献   

7.
随着高校毕业生人数的增加和管理信息系统的应用,产生并积累了大量的、复杂的毕业生就业信息数据。文章以这些数据作为挖掘对象。利用Apriori算法找出影响毕业生就业率的频繁出现因素,有助于提高对毕业生就业指导的实效性。实现毕业生更快更好的就业。  相似文献   

8.
在FP-growth关联规则算法的基础上提出了基于动态二维数组的算法,引入可变二维数组结构,动态的将事务数据库存入该数组中,可以大大提高数据挖掘的效率。并以图书馆管理系统中的图书借阅数据作为训练数据,使用改进的FP-growth算法实现了高校图书推荐系统,本系统能够从图书馆图书借阅记录中挖掘和发现读者借阅行为中隐含的规律,得到读者与图书的频繁项集,从而可以实现对不同身份的读者推荐不同类型的图书功能。  相似文献   

9.
FP-growth算法的实现方法研究   总被引:8,自引:0,他引:8  
事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。  相似文献   

10.
管理信息系统的应用使得职业学校的就业指导工作产生了质的飞跃,但随着毕业生人数的极具增长,系统中不可避免地积聚了大量的就业信息数据,与之匹配的统计方法已不能适应现实的需求。数据挖掘技术可以有效解决这一问题,它所包含的Apriori算法,能建立在学校的就业历史数据之上,深入分析毕业生的就业数据从而发现真正影响学生就业问题的内因,还能通过结合学生的受教育与就业需求之间的相关性,分析出社会对人才的真正需求,进而为职业学校的管理者提供参考数据,帮助他们对学校的教育模式进行改革,使其更契合当下社会对人才的需求,从而最大程度地提高毕业生就业指导工作的有效性。  相似文献   

11.
为解决西装定制企业中用户定制款式信息未充分利用这一问题, 结合关联规则FP-growth算法对多维大型数据集进行挖掘时, 存在内存资源消耗较大以及执行效率不高的问题, 本文提出一种改进FP-growth融合K-means算法的西装定制搭配挖掘方法, 对FP-growth算法从使用哈希表建立项头表、有序FP-tree代替传统FP-tree建树过程和新增不平衡比评价指标3个角度对其进行改进. 实验结果表明, 与其他关联规则算法对比, 改进FP-growth算法的内存资源使用减少了约6.7%、执行效率提高了15%左右; 通过人工审核实验结果得出, 该算法将挖掘出用户感兴趣且有意义的关联规则, 验证该算法提出的可行性.  相似文献   

12.
负载均衡的FP-growth并行算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。  相似文献   

13.
提出了一种高效的挖掘数据仓库中多维关联规则的MDP算法。MDP算法通过构造一种扩展的前缀树MDP-tree,将数据仓库中的有效信息压缩存储,再使用基于MDP-tree的MDP-mining方法快速发现有趣的关联规则。MDP算法仅需要扫描一次数据仓库,就可以构造出MDP-tree,进而得到所有的关联规则。该算法还具有频繁模式查找简捷、二次查找迅速等优点。通过实验验证了MDP算法的高效性和稳定性,与传统的多维关联规则算法相比有更好的性能。  相似文献   

14.
关联规则挖掘是数据挖掘领域重要的挖掘技术,与之类似,将非结构化的文本内容转化成结构化的特征向量形式后,也可以在大规模文本集中发现基于特征词的频繁模式或关联规则。关联规则挖掘是一个标准的数据挖掘任务,开创性工作始于文献Mining association rules between sets of items in large databases。其目的在于发现已知事务集中各项间的关联关系,  相似文献   

15.
快速关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
高俊  施伯乐 《计算机科学》2005,32(3):200-201
本文在分析FP-growth关联规则挖掘算法的基础上,提出了一种称之为MFP的算法,给出了算法的工作原理。MFP算法能在一次扫描事务数据库过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。  相似文献   

16.
17.
18.
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上, 改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。  相似文献   

19.
在信息化和数字化大环境下,针对学校大量学生信息和学生成绩数据的管理和应用,基于数据挖掘技术中关联规则的算法做了陈述,通过对Apriori算法和FP-growth算法进行分析对比,阐述了FP-growth算法的优势,采用FP-growth算法对不及格学生成绩数据进行预处理和关联挖掘,得出了数学科目的关联拓扑图,以拓扑图分析了数学与其他科目的关联,对于学校的教务管理有一定的预警作用.  相似文献   

20.
本文通过对所调研的广西电力职业技术学院中现有的毕业生就业历史数据进行数据挖掘,从数据中寻找规则来验证在当今的职业教育中学生在校期间的成绩、专业、家庭的经济状况、就业的时间对学生就业是否存在着影响;并选择适当的挖掘算法、合适的数据挖掘软件和工具,形成一个可行的针对于职业教育中成绩、专业、家庭、时间、就业的数据挖掘规则,使其能应用于职业教育毕业生的就业指导的决策和研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号