首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
将数据挖掘技术应用于高速公路系统中,利用挖掘得到的模式对高速公路管理提供有效支持,数据预处理关系到收费数据的挖掘质量,针对丢卡、坏卡、回头车等存在的问题,对数据预处理进行了改正,并给予算法实现。  相似文献   

2.
随着Internet的普及,Web日志挖掘成为一个新的研究课题。由于Web日志数据的半结构化,为了得到有效的挖掘模式,提高挖掘算法的效率,首先需要对数据预处理。该文详细介绍了Web日志数据预处理的四个步骤:数据清洗,用户识别,会话识别和路径补充,并实现了对某校院网日志记录的预处理,得到了理想的结果。  相似文献   

3.
日志挖掘中的数据预处理   总被引:1,自引:0,他引:1  
日志信息的预处理是日志挖掘任务中的重要阶段,是当前研究的重点,同时也是整个日志挖掘过程的基础和实施有效挖掘算法的前提,在日志挖掘中起着重要的作用.目前主要的日志挖掘主要采用国外的几种软件,而日志挖掘中重要的数据预处理软件国内暂无.文中主要介绍了数据挖掘中的日志挖掘,分析了数据预处理的过程,以及如何实现日志挖掘中的数据预处理,并在Delphi开发工具中成功完成了IIS文本日志文件到Xls格式及XNIL格式文件的转换,实现了日志挖掘中的数据预处理.  相似文献   

4.
数据预处理将原始的真实数据库转换成适于数据挖掘的挖掘数据库,为挖掘算法更好的实现以及挖掘结果形象的显示打下了良好的基础。本文针对结构化数据讨论了数据预处理的两个目标:消除现实数据库中的数据缺陷;为数据挖掘做准备。  相似文献   

5.
数据预处理是整个Web使用挖掘过程的基础和实施有效挖掘算法的前提,在Web使用挖掘中起着重要的作用。论述数据预处理在Web使用挖掘中的重要性,详细分析Web使用挖掘数据预处理过程.在数据预处理的每个阶段给出一些规则并针对这些规则设计相应的预处理算法。  相似文献   

6.
日志信息的预处理是日志挖掘任务中的重要阶段,是当前研究的重点,同时也是整个日志挖掘过程的基础和实施有效挖掘算法的前提,在日志挖掘中起着重要的作用。目前主要的日志挖掘主要采用国外的几种软件,而日志挖掘中重要的数据预处理软件国内暂无。文中主要介绍了数据挖掘中的日志挖掘,分析了数据预处理的过程,以及如何实现日志挖掘中的数据预处理,并在Delphi开发工具中成功完成了IIS文本日志文件到Xls格式及XML格式文件的转换,实现了日志挖掘中的数据预处理。  相似文献   

7.
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。详细分析了数据预处理的过程,提出一种改进的数据清洗方法,以提高日志挖掘中数据预处理的效率,并针对Web日志数据预处理中会话识别这一重要环节,提出一种改进的会话识别方法。在用户识别后,根据页面内容、站点结构确定页面重要程度,对阈值进行调整。然后,根据用户对页面内容的兴趣度来删除会话中的链接页面和不感兴趣的页面。实验结果表明,提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合。  相似文献   

8.
Web日志挖掘中数据预处理技术的研究   总被引:1,自引:1,他引:1  
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果.详细分析了数据预处理的过程,提出一种改进的数据清洗方法,以提高日志挖掘中数据预处理的效率,并针对Web日志数据预处理中会话识别这一重要环节,提出一种改进的会话识别方法.在用户识别后,根据页面内容、站点结构确定页面重要程度,对阈值进行调整.然后,根据用户对页面内容的兴趣度来删除会话中的链接页面和不感兴趣的页面.实验结果表明,提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

9.
探索性仿真是一种研究复杂系统的科学手段,而数据挖掘是处理探索性仿真所产生的海量数据,而在实施数据挖掘前如何进行有效的数据预处理成为当前仿真领域面临的难题。为解决目前在探索性仿真中数据预处理工作存在的目标不够明确、重点不够突出等问题,提出了探索性仿真数据预处理需求分析,结合探索性仿真数据的特点,首先分析了通用数据预处理需求,之后对决策树挖掘、关联规则挖掘、聚类分析三种典型数据挖掘算法的数据预处理需求进行了分析。研究成果较好地满足了探索性仿真数据预处理工作的需求。  相似文献   

10.
Web数据挖掘中的数据预处理   总被引:11,自引:0,他引:11  
Web数据挖掘是分析网络应用的主要手段,其数据源一般是网络服务器日志,然而日志记录的是杂乱的,不完整的,不准确的并且是非结构化的数据,必须进行数据预处理。文章将预处理过程分为3个阶段-数据清洗、区分使用者,会话识别,并提出了一个高效的Web数据挖掘预处理结构WLP和相应的算法。  相似文献   

11.
根据目前数据挖掘研究的现状,分析不确定数据的聚类挖掘算法。针对不确定数据聚类挖掘存在的问题,提出改进传统的数据挖掘算法来适合不确定数据的聚类挖掘或找出新的聚类挖掘算法,来解决不确定数据聚类挖掘问题的新思路。  相似文献   

12.
数据可视化在数据挖掘中的应用   总被引:2,自引:0,他引:2  
数据挖掘是从大量历史数据中抽取潜在的、有价值的知识或规则的过程。数据可视化对于快速分析数据,表示高维数据方面非常直观、有效。本文首先讨论了几种可视化技术,随后就数据可视化在数据挖掘的模型、过程中的应用进行探讨。  相似文献   

13.
数据清理中几种解决数据冲突的方法   总被引:5,自引:0,他引:5  
建立数据挖掘模型的基石是数据仓库,数据仓库的质量直接影响到数据挖掘模型的建立与执行效率,并有可能影响到数据挖掘模型的最终结果的准确度。数据清理就是发现数据中的错误和不一致并加以消除,以提高数据的质量,使得数据挖掘模型建立的过程更加快捷和简便,挖掘出来的模式和规则也就更加有效和适用。  相似文献   

14.
数据挖掘中数据预处理的研究与实现*   总被引:18,自引:1,他引:17  
数据预处理将原始的真实数据库转换成适于数据挖掘的挖掘数据库,为挖掘算法更好的实现以及挖掘结果形象的显示打下了良好的基础。针对结构化数据讨论了数据预处理的两个目标:消除现实数据库中的数据缺陷;为数据挖掘做准备。并在此基础上,介绍了数据挖掘软件KDD中数据预处理技术的实现。  相似文献   

15.
新一代数据挖掘语言分析及应用*   总被引:5,自引:0,他引:5  
关系查询语言的标准化为关系系统的开发奠定了基础,同样好的数据挖掘查询语言也必将有助于挖掘系统平台的标准化。由于数据挖掘覆盖了广泛的分析任务,而且每个任务又具有各自不同的需求,因而开发、设计完善的数据挖掘语言具有非常重要的意义。介绍了新一代数据挖掘语言及应用状况,标准化的数据挖掘工具将使客户从降低成本和投资、方便使用中受益,也将使数据挖掘成为企业决策系统中不可或缺的一部分。  相似文献   

16.
本文主要讨论了数据流挖掘的现状及发展,简要地介绍了数据流挖掘的概念,详细地介绍了数据流挖掘的特点及其数据模型的特点,介绍了几种常用数据流挖掘流挖掘方法。  相似文献   

17.
数据挖掘工具的应用与标准化   总被引:4,自引:0,他引:4  
苏卫 《计算机工程》2004,30(Z1):40-42
介绍了数据挖掘概念,给出了目前数据挖掘工具的主要分类及存在的问题,探讨了数据挖掘语言的发展对数据挖掘工具标准化的推 动作用,并对数据挖掘工具未来的发展进行了展望。  相似文献   

18.
数据仓库与数据挖掘是当今新的技术热点,数据仓库是一种解决数据使用的高效技术,数据挖掘为之提供更好的决策支持和服务,同时促进数据仓库技术的发展。主要介绍这两者的概念、应用,以及它们之间的关系。  相似文献   

19.
李岩 《现代计算机》2011,(20):53-55
数据仓库与数据挖掘是当今新的技术热点,数据仓库是一种解决数据使用的高效技术,数据挖掘为之提供更好的决策支持和服务,同时促进数据仓库技术的发展。主要介绍这两者的概念、应用,以及它们之间的关系。  相似文献   

20.
Web日志挖掘数据预处理研究   总被引:6,自引:0,他引:6  
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号