首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
Microsoft在SQLServer2000中第一次包含了数据挖掘功能.其数据挖掘解决方案基于OLEDB规范,为数据挖掘提出了一种新的类SQL语言,便于开发者更好地建立数据挖掘的应用.利用SQLServer2000去创建数据仓库,对关联规则数据挖掘经典算法Apriori进行改进和测试,在算法效率上得到明显提高.  相似文献   

2.
浅析常用聚类分析算法   总被引:1,自引:0,他引:1  
聚类分析是数据挖掘中的核心技术,本文对数据挖掘领域的聚类分析方法及代表算法进行分析,并对算法性能进行比较.  相似文献   

3.
以基于数据挖掘关联规则的Apriori算法基本原理为依据,介绍了高校人力资源数据挖掘系统主要功能模块的组成,着重研究了Apriori算法的设计与实现.该数据挖掘系统为高校人力资源决策提供了科学的依据,在高校人力资源管理应用中做出了有益的尝试.  相似文献   

4.
从数据库的应用发展方面,描述了数据挖掘的概念,讨论了数据挖掘的主要算法,给出了数据挖掘的应用概况及其实例.  相似文献   

5.
介绍了数据挖掘在入侵检测中的应用,阐述了数据挖掘中分类规则和分类数学模型,分析和讨论了RIPPER算法的原理,并用RIPPER算法优化了入侵检测系统中常用的短序列匹配算法,说明了优化算法的有效性.  相似文献   

6.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点.针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述.最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望.  相似文献   

7.
根据日常商务数据的特点,提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的改进的多支持度关联规则算法,并结合具体实例进行了分析.分析结果表明,2种改进的算法可以有效地提高系统数据挖掘的效率.  相似文献   

8.
针对医学领域的生物大数据挖掘问题,总结了当前国内外医学数据挖掘的进展,提出了医学大数据挖掘的基本流程,分析了流行的生物医学数据挖掘算法,设计了基于R软件的生物医学数据挖掘Web系统.  相似文献   

9.
关联规则挖掘及其在课堂教学评价中的应用   总被引:2,自引:0,他引:2  
研究了数据挖掘技术中的关联规则算法,对经典的Apriori算法作了全面的分析,指出了挖掘中的关键步骤,并对算法做了适当的调整,提高了整个算法的效率;将关联规则数据挖掘的方法运用到课堂教学评价中,从教学评价数据中进行数据挖掘,找到课堂教学效果与教师基本情况的关系,从而为更好地开展教学工作,提高教学质量提供参考依据.  相似文献   

10.
在文本大数据挖掘过程中受到语义模糊性因素的影响,导致大数据挖掘查准性不好,故提出了一种基于模糊层次聚类分析和语义相似性关联特征提取的大数据挖掘算法.该算法采用泛化映射构造语义概念树,结合二元语义分析方法进行大数据分布式本体模型构建,并采用模糊层次分析方法进行大数据的语义相似性和关联性判断,提取大数据信息流的语义关联特征,结合模糊C均值算法对提取的特征量进行聚类分析,自适应均匀遍历学习方法进行大数据挖掘中关联特征量的信息融合处理,求得挖掘目标函数的最优解,实现大数据优化挖掘.仿真结果表明,采用该算法的语义指向性较好,数据的聚焦性能较优,提高了数据挖掘的查全率和查准率,总体性能稳定可靠.  相似文献   

11.
在分析空间数据和空间数据挖掘的不确定性基础上,针对传统空间数据挖掘的局限性,将空间数据的不确定性和空间数据挖掘的不确定性有机结合,以EM算法和Apriori算法为基础,建立了不确定性空间数据挖掘算法模型,包括不确定性空间数据聚类算法(UNEM)和不确定性空间数据关联规则挖掘模型(USAR).并以中国37个有代表性的大中城市的地理空间经济数据为例,进行实验验证,结果表明:采用不确定性空间数据挖掘算法模型比传统的空间数据挖掘方法得到的知识更为真实客观.  相似文献   

12.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

13.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

14.
针对现有数据挖掘软件不支持用户有序、动态地按需定制并行数据挖掘算法,且不能充分利用计算集群的能力,分析了 Hadoop技术及其多种数据处理组件,提出应用 Mahout分布式数据挖掘算法库和 Oozie 工作流技术在 Hadoop 中构建数据挖掘工作流的方法,并设计实现了一个聚类工作流实例。实验结果证明,该方法简单,且能有效地组织数据挖掘流程。  相似文献   

15.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

16.
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集.Apriori算法是频繁项集挖掘的有效算法.在Apriori的算法中,采用哈希树存储平凡项集的候补项集以便快速计算其支持度.本文在分析算法所存在的效率瓶颈的基础上,提出了一个有效的改进算法,通过利用一维数组替代算法中复杂的哈希树...  相似文献   

17.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

18.
为了提高挖掘用户频繁行为模式的速度和FP-树空间利用率,从而显著提高安全审计数据分析的效率,本文在FP-growth算法的基础上提出了一种改进的适于安全审计数据分析的挖掘频繁模式算法。与FP-growth算法相比,改进算法在挖掘频繁模式时不生成条件FP-树,挖掘速度提高了1倍以上,所需的存储空间减少了一半。  相似文献   

19.
基于DM技术动态实现财会软件的智能感知功能   总被引:1,自引:0,他引:1  
介绍了数据挖掘与软件智能感知的基本概念,探讨了在软件智能和实现过程中用数据挖掘技术代替手工处理的可行性,作者综合知识发现领域已有的研究成果,结合财会软件的智能化提出了一个实用的挖掘算法,它动态地从软件不断积累的数据中撮关联规则知识,并利用这些知识根据用户填制凭证时的工作状态智能化地调整科目的显示顺序,该算法能避免进行大量的运算,实验表明它是实际可行的。  相似文献   

20.
随着人们对隐私权的越来越重视,隐私保护数据挖掘成为当前研究热点.分类算法作为一个重要的数据挖掘方法被应用到各个领域,其中支持向量机(SVM)是分类算法中一个重要方法.并且数据的隐私性和安全性是人们关注的重点.本文对SSP协议进行扩展提出了一个基于垂直分布数据的隐私支持向量机算法,这个算法具有更高的效率和更好的安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号