共查询到20条相似文献,搜索用时 62 毫秒
1.
数据预处理在Web日志挖掘过程中起着至关重要的作用。本文详细分析了数据预处理的过程,并对用户识别提出了改进策略,最后实现了一个Web日志挖掘预处理模型(WLMPM)。 相似文献
2.
数据预处理是整个Web使用挖掘过程的基础和实施有效挖掘算法的前提,在Web使用挖掘中起着重要的作用。论述数据预处理在Web使用挖掘中的重要性,详细分析Web使用挖掘数据预处理过程.在数据预处理的每个阶段给出一些规则并针对这些规则设计相应的预处理算法。 相似文献
3.
在数据挖掘研究领域中,数据预处理起着十分重要的作用。Web使用挖掘的数据源最主要的是Web日志.本文介绍了Web日志的格式,针对Web日志的特点。介绍预处理过程中一些特殊情况的处理方法。 相似文献
4.
Web日志是目前Web数据挖掘的重要研究方向。数据预处理是Web日志挖掘中的关键技术。详细的介绍了Web日志挖掘的预处理过程。数据预处理包括数据清理、识别用户、识别会话和框架页面清理、路径补充。用户识别后,框架页面降低了数据挖掘的效率,可以通过过滤框架页面大幅度减少产生的无效页面数。 相似文献
5.
Web数据挖掘技术是近年来数据挖掘领域的研究重点之一。由于Web文档具有半结构化的特点,在执行具体的挖掘操作之前,对Web文档进行预处理是必不可少的。文章针对Web内容挖掘的预处理过程,提出一种以XML作为中介语言进行数据预处理的方法。 相似文献
6.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分。数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等。本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法。 相似文献
7.
基于Web挖掘的网页清洗技术 总被引:1,自引:0,他引:1
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。 相似文献
8.
9.
10.
基于用户访问树的Web日志挖掘数据预处理 总被引:1,自引:0,他引:1
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献
11.
12.
华铨平 《计算机工程与设计》2010,31(6)
在众多提高数据挖掘效率的方法中,并行数据挖掘是一个从根本上解决该问题的有效途径.首先指出在数据挖掘过程中,不论采用顺序挖掘还是并行挖掘,都必须以数据挖掘的最终目的为前提,即尽可能多地发现数据中所含有的有用的知识,然后在此基础上提高数据挖掘的较率.在该想法基础上,提出了面向数据特征的数据划分过程,并进一步提出了加权式的并行数据挖掘基本方法.在这种数据挖掘过程中,可以得到相对于部分数据的知识,在很大程度上提高了数据挖掘的动态性能. 相似文献
13.
根据目前数据挖掘研究的现状,分析不确定数据的聚类挖掘算法。针对不确定数据聚类挖掘存在的问题,提出改进传统的数据挖掘算法来适合不确定数据的聚类挖掘或找出新的聚类挖掘算法,来解决不确定数据聚类挖掘问题的新思路。 相似文献
14.
15.
王镇西 《数字社区&智能家居》2009,(35)
高等学校教学质量管理需要数据挖掘系统来支持。介绍了数据挖掘技术以及常用的数据挖掘方法,对如何设计基于SQL Server的高校教学质量数据挖掘系统进行了探讨。以决策树方法为基础、SQL Server为挖掘平台,设计了教学质量数据挖掘模块,实现了教学质量数据挖掘系统。 相似文献
16.
Xin-Dong Wu 《计算机科学技术学报》2009,24(6):1018-1027
Due to the increasing availability and sophistication of data recording techniques, multiple information sources and distributed
computing are becoming the important trends of modern information systems. Many applications such as security informatics
and social computing require a ubiquitous data analysis platform so that decisions can be made rapidly under distributed and
dynamic system environments. Although data mining has now been popularly used to achieve such goals, building a data mining
system is, however, a nontrivial task, which may require a complete understanding on numerous data mining techniques as well
as solid programming skills. Employing agent techniques for data analysis thus becomes increasingly important, especially
for users not familiar with engineering and computational sciences, to implement an effective ubiquitous mining platform.
Such data mining agents should, in practice, be intelligent, complete, and compact. In this paper, we present an interactive
data mining agent — OIDM (online interactive data mining), which provides three categories (classification, association analysis,
and clustering) of data mining tools, and interacts with the user to facilitate the mining process. The interactive mining
is accomplished through interviewing the user about the data mining task to gain efficient and intelligent data mining control.
OIDM can help users find appropriate mining algorithms, refine and compare the mining process, and finally achieve the best
mining results. Such interactive data mining agent techniques provide alternative solutions to rapidly deploy data mining
techniques to broader areas of data intelligence and knowledge informatics. 相似文献
17.
A Basic Primer on Data Mining 总被引:1,自引:0,他引:1
18.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点. 相似文献
19.
对大型数据库进行数据开采时,数据抽取问题及数据库和开采算法的接口设计就变得十分重要,通过定义SQL数据开采抽取器,设计了数据开采算法和数据库管理系统接口的框架体系,并通过常用的数据开采算法C4.5说明了这种标准的SQL数据开采抽取器的适用性。 相似文献
20.
数据可视化在数据挖掘中的应用 总被引:2,自引:0,他引:2
数据挖掘是从大量历史数据中抽取潜在的、有价值的知识或规则的过程。数据可视化对于快速分析数据,表示高维数据方面非常直观、有效。本文首先讨论了几种可视化技术,随后就数据可视化在数据挖掘的模型、过程中的应用进行探讨。 相似文献