首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于数据挖掘的启发式抽样方法研究   总被引:1,自引:0,他引:1  
在数据挖掘中应用抽样技术,可以显著提高数据挖掘任务的效率.通过采用不同的抽样方法,使得数据挖掘算法可以针对比原始数据集小得多的样本数据集进行分析,从而大幅度提高性能.随之而来的问题就是,由于采用了抽样方法,在大幅提高性能的同时,对分析的精确性就会产生影响.如何选取合适的反映总体数据水平的样本成为数据挖掘中的关键问题.传统意义上的抽样大多采用单一的抽样方法,进行单一抽样,抽取的样本在一定程度上具有局限性.本文对传统抽样方法和样本容量的选取进行总结,对传统的分层抽样思想进行改进,提出了一种新的基于数据挖掘的启发式抽样思想,大大提高了抽取样本的精确性.  相似文献   

2.
抽样技术在序列模式增量更新中的应用   总被引:1,自引:0,他引:1  
在这篇文章中,我们提出了一种应用抽样的技术于序列挖掘的算法。这个方法能在原始数据库和更新后的数据库之间评价序列模式的变化。评价了序列模式的变化我们能决定何时使用精确的挖掘算法或增量算法:如果变化达到一定程度,就使用精确的方法以挖掘新的序列模式;如果变化比较小,则在一定的可信度情况下,就使用原来的模式,且误差能控制在一定的范围内。  相似文献   

3.
针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法.利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能够灵活地控制对数据集不同区域的抽样率.实验证明,在大规模数据集上进行聚类时,密度偏差抽样在时间复杂度上要优于随机抽样.  相似文献   

4.
Web缓存是规划Internet的重要技术之一,替换策略对Web缓存系统的性能起着举足轻重的作用。网络环境与CPU和虚拟内存比起来允许使用更复杂的替换策略,并且网络环境的复杂性也需要精致的替换策略。大部分替换策略都是基于特定工作负载模型的,灵活性差。将数据挖掘应用于Web缓存中,提出一种事件驱动的自适应替换策略。使得Web缓存系统在网络工作负载模型变化时,不必更改替换算法库就能较好地提供服务。  相似文献   

5.
《软件工程师》2016,(5):35-38
针对大数据时代背景下中小型超市面临的挑战及数据分析应用于中小型超市辅助决策的现状,提出了适时调整货架位置及动态预测商品销售趋势的营销策略,建立了数据管理、分析、决策模型,综合应用数据挖掘算法Apriori及Vague集求解该模型,在此基础上设计并实现了超市营销系统。利用中小型超市的实际销售数据实验,结果表明该系统的应用不仅使得超市日常经营管理更加便捷、高效,其数据分析功能为管理者提供了决策支持,为超市带来约8%的利润提升。  相似文献   

6.
近年来,数据挖掘技术的应用越来越广泛。本文研究了空间挖掘技术的理论、过程及方法.并在此基础上提出了一种基于MapX的空间数据挖掘系统结构,以及挖掘过程中所需的数据预处理方法和挖掘算法,为数据挖掘与GIS的集合找到了一种解决方法。  相似文献   

7.
将数据挖掘技术应用到防止电信客户流失中,以某电信运营商的历史资料为对象,建立客户流失预测模型。并对高价值高流失概率的客户进行K-means聚类分析,同时对不同流失客户群提供相应的营销策略。  相似文献   

8.
为了减少关联规则挖掘算法的I/O时间复杂性,本文在指出现有关联规则算法及原始抽样挖掘算法存在不足的基础上,提出了一种新的基于抽样的海量数据关联规则挖掘算法,该算法采用随机抽样方法挖掘关联规则,将频繁项集求解中的计数计算次数减少到最低,从而提高了算法的效率.  相似文献   

9.
网格计算是分布计算的一个新的重要的分支,它主要是实现了大规模资源的共享,并且达到了高性能。在许多应用中,需要对大量的数据集进行分析,而这些数据通常是地理上分布的大规模的数据,并且复杂度不断在增加。对于以上的这些应用,网格技术提供了有效的支持,介绍了网格的基础设施以及分布式数据挖掘。  相似文献   

10.
教务管理系统作为数字化校园重要组成部分之一,是涉及教务管理各环节、面向学校各部门以及各层次用户的多模块综合管理信息系统。在使用中会产生大量的有用的和无用的数据,可以通过数据挖掘技术来对这些数据进行分析,从而达到高效、人性化的管理。  相似文献   

11.
讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

12.
本文首先对数据挖掘技术进行了系统的分析和说明,并详细叙述了数据挖掘的过程以及几种技术和方法,最后对数据挖掘技术在各个领域的应用做了叙述。  相似文献   

13.
介绍了自90年代以来新兴的一项决策支持技术-数据挖掘,结合医学领域的实际特点探讨了数据挖掘在其中的应用方向及具体方法.同时展望了数据挖掘技术在医学领域中的应用前景.  相似文献   

14.
数据挖掘工具的应用与标准化   总被引:4,自引:0,他引:4  
苏卫 《计算机工程》2004,30(Z1):40-42
介绍了数据挖掘概念,给出了目前数据挖掘工具的主要分类及存在的问题,探讨了数据挖掘语言的发展对数据挖掘工具标准化的推 动作用,并对数据挖掘工具未来的发展进行了展望。  相似文献   

15.
本文从ERP与数据挖掘的基本概念出发,分析了ERP中应用数据挖掘的原因,提出基于数据仓库的数据挖掘应用框架,总结其优点和不足,为ERP中数据挖掘的应用提供参考。  相似文献   

16.
在介绍数据挖掘技术的基础上,从资源建设、用户分析等方面探讨数据挖掘在图书馆服务管理中的作用及实施数据挖掘的具体过程。  相似文献   

17.
数据挖掘及隐私保护在医学中的应用   总被引:1,自引:0,他引:1  
数据挖掘对医学数据分析具有非常重要的意义,首先阐述了数据挖掘在医学中的应用,然后改进了一种非常有效的保护医学数据的方法,该方法不会影响数据分析的结果,同时它又满足医学数据对安全性和准确性的需求。  相似文献   

18.
CRM是一种帮助企业向客户提供优质服务的工具,在CRM中利用数据挖掘技术不断的收集、分析客户资料,从而达到保有优质老客户、获取新顾客的目的,帮助企业制定有效的营销策略,提高企业的收益率。  相似文献   

19.
数据挖掘技术在教育中的应用研究   总被引:3,自引:0,他引:3  
杨永斌 《计算机科学》2006,33(12):284-286
随着教育信息化进程的推进,产生并积累了大量的、复杂的数据,为了更充分、有效地利用这些数据,本文就数据挖掘技术在教育中的应用进行了一些探讨,并以教学评价作为简单的实例研究,目的在于发现大量教育数据中隐藏的、有用的知识,以指导教育、发展教育、为教育服务。  相似文献   

20.
随着CRM(客户关系管理系统)的不断发展和应用,使用数据挖掘技术进行客户分析变得越来越重要,尤其像电信这种以客户为中心的行业。本文在分析近年来CRM信领域的应用现状的基础上,介绍了数据挖掘技术和客户关系管理概念,并着重阐述了将数据挖掘技术应用到CRM的步骤和流程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号