首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
数据挖掘是一种知识发现技术,近年来得到了快速的发展。数据预处理是数据挖掘过程中的一个重要步骤,尤其是在对包含有噪声、空缺,甚至是不一致数据进行数据挖掘时,更需要进行数据的预处理,以提高数据挖掘对象的质量,并最终达到提高数据挖掘所获模式知识质量的目的。本文讨论了在劳动保障数据挖掘工作中,如何应用数据预处理技术。  相似文献   

2.
数据预处理在IT基础设施监控系统中的应用   总被引:1,自引:0,他引:1  
数据质量的优劣对数据挖掘的成败有着举足轻重的影响,而作为数据挖掘过程第一步的数据预处理就是为了确保数据质量而设,其研究方兴未艾.从数据质量的概念出发,介绍了数据预处理的体系结构和常用方法,根据IT基础设置监控系统中的数据特点,探讨了数据预处理技术在该类数据上的典型应用.  相似文献   

3.
陈亮  卢欣荣  曹文梁 《福建电脑》2007,(7):30-31,49
迄今为止,数据挖掘与知识发现软件的功能不再停留在“挖掘”这个单一功能的实现,而已延伸到数据挖掘与知识发现的过程.即包括数据的预处理、数据挖掘、模型评估与可视化;在单纯的模型可视化基础上扩充了数据可视化与数据挖掘过程可视化:本文着重讨论了数据挖掘的方法与可视化技术,最后提出了未来的研究方向。  相似文献   

4.
蔡鑫 《计算机工程》2007,33(24):44-45
从工程化实施电信数据挖掘项目的角度出发,在满足具体商业问题建模的数据要求前提下,对数据准备过程进行了结构化的分析和分解,提出一种规范化方法来约束宽表结构、源系统接口方式、数据预处理流程,并且预定义了相应的数据探索和数据准备过程,从源头改进电信数据挖掘项目的实施效率和质量。  相似文献   

5.
利用数据挖掘技术对电力企业数据进行处理使得处理过程更加简洁有效。分析了现有的数据预处理技术,研究了数据预处理中Z-score标准化和FCM聚类算法,设计了新的数据预处理流程,利用电力营销数据验证了数据预处理的有效性。  相似文献   

6.
基于MapX的空间数据挖掘模型及其应用   总被引:7,自引:0,他引:7  
利用Mapx控件对GIs数据强大的操作与处理功能,将Mapx应用到空间数据挖掘中,构建了基于MapX的空间数据挖掘模型。通过该模型可以方便的对空间数据与非空间数据进行操作处理,以及空间对象之间的拓扑关系与距离信息等进行判定,从而解决了空间数据挖掘中数据整合与数据预处理的问题。概念泛化技术应用于数据预处理中,构建了概念层次树。关联规则算法有效应用于空间数据挖掘中.荻取了有用的知识。  相似文献   

7.
网络安全隐患数据具有海量化、复杂化、多元化的特点,因此在对网络安全隐患数据进行挖掘时存在执行时间长、挖全率低、内存消耗量大的问题。为了优化网络安全隐患数据挖掘效果,研究了基于关联规则算法的网络安全隐患数据挖掘模型。计算关联权值和平均值,由此获取数据项集关联度的准确性。通过判别关联程度,完成数据预处理。采用Apriori算法对预处理后的数据进行量化处理,抽取、挖掘、记录可应用数据信息。利用亲和度函数建立目标函数,以获取隐患数据。建立关联规则,以确保隐患数据差异。以可信度结果为基础,构建网络安全隐患数据挖掘模型,实现网络安全隐患数据挖掘。试验结果表明,采用此模型后,执行时间较短、挖全率较高、数据挖掘过程中占用的内存较少。该研究可为网络安全隐患数据挖掘系统设计提供有效支持。  相似文献   

8.
提出了采用关联规则Apriori算法对煤矿生产调度子系统进行频繁模式数据挖掘的方案,详细描述了对煤矿生产数据进行预处理以及运用Apriori算法对预处理后的数据挖掘频繁项集的过程,分析了频繁项集中关联规则的含义,并提出了进一步提高数据挖掘功能的方案。  相似文献   

9.
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。  相似文献   

10.
近年来,数据挖掘技术的应用越来越广泛。本文研究了空间挖掘技术的理论、过程及方法.并在此基础上提出了一种基于MapX的空间数据挖掘系统结构,以及挖掘过程中所需的数据预处理方法和挖掘算法,为数据挖掘与GIS的集合找到了一种解决方法。  相似文献   

11.
在医院中院内感染是一个不可忽视的问题。医院内每天产生大量的数据,迫切需要挖掘出这些数据中与院内感染有关的因素。而数据预处理技术的好坏直接影响到数据挖掘的结果。介绍了针对院内感染数据挖掘系统,在关联规则挖掘前的数据预处理技术。  相似文献   

12.
数据预处理在数据挖掘项目中有着举足轻重的作用,是数据挖掘整个过程的关键步骤之一。论文根据粗糙集概率模型应用于数据挖掘的特点,提出了一种用于数据预处理的基于信息归纳的概率粗糙集算法SRII;实验证明,SRII结合算法C4.5应用于数据挖掘具有良好的效率与显著改进的挖掘结果。  相似文献   

13.
数据预处理是Web使用挖掘的一个关键环节,数据预处理的结果直接影响到后续步骤,如事务识别、路径分析、关联规则挖掘和序列模式挖掘的效果。提出了一种精确识别用户和会话的数据预处理算法(USIA),并且用实验证明它是高效的。  相似文献   

14.
基于用户访问树的Web日志挖掘数据预处理   总被引:1,自引:0,他引:1  
刘加伶  范军 《计算机科学》2009,36(9):154-156
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理.  相似文献   

15.
高速公路挖掘数据预处理的研究   总被引:1,自引:1,他引:1  
将数据挖掘技术应用于高速公路系统中,利用挖掘得到的模式对高速公路管理提供有效支持,数据预处理关系到收费数据的挖掘质量,针对丢卡、坏卡、回头车等存在的问题,对数据预处理进行了改正,并给予算法实现。  相似文献   

16.
Web日志挖掘中的数据预处理的研究   总被引:41,自引:1,他引:40  
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。  相似文献   

17.
在数据挖掘过程中数据预处理至关重要,针对不同的领域和行业,数据预处理的方法千差万别。详细描述信用卡客户细分和关联规则分析中的数据预处理过程,首先从信用卡系统数据库中选择与分析主题有关的数据表,然后对经过选取后得到的数据,通过数据清理、集成、变换和归约处理过程得到挖掘所需的样本数据。  相似文献   

18.
Data mining is the process of secondary analysis of large databases aimed at finding unsuspected relationships which are of interest or value to the database owners. We analyze the statistical methods in the classification in data mining, include: preprocessing techniques, classification algorithms, and post-classification analysis. Also, we introduce the Bayesian networks for data mining.  相似文献   

19.
Web日志挖掘数据预处理研究   总被引:6,自引:0,他引:6  
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

20.
Web日志是目前Web数据挖掘的重要研究方向。数据预处理是Web日志挖掘中的关键技术。详细的介绍了Web日志挖掘的预处理过程。数据预处理包括数据清理、识别用户、识别会话和框架页面清理、路径补充。用户识别后,框架页面降低了数据挖掘的效率,可以通过过滤框架页面大幅度减少产生的无效页面数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号