基于XML的Web数据挖掘的研究 Research of Web Data Mining Based on XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于XML的Web数据挖掘的研究

引用本文：	刘振岩,王万森.基于XML的Web数据挖掘的研究[J].计算机科学,2003,30(5):42-43.

作者姓名：	刘振岩王万森

作者单位：	首都师范大学信息工程学院,北京,100037

基金项目：	北京市自然科学基金(4012006)

摘要：	1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就
关键词：	Web 数据挖掘 XML 数据库数据仓库数据源数据管理
Research of Web Data Mining Based on XML

LIU Zhen-Yan WANG Wan-Sen.Research of Web Data Mining Based on XML[J].Computer Science,2003,30(5):42-43.

Authors:	LIU Zhen-Yan WANG Wan-Sen

Abstract:	The paper advances a system framework of Web data mining based on XML. This system framework integrates Information Retrieval with Information Extraction, and utilizes traditional data mining methods to complete Web data mining through XML.

Keywords:	Web data mining XML Information retrieval Information extraction
本文献已被 CNKI 维普万方数据等数据库收录！
	点击此处可从《计算机科学》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏