首页 | 本学科首页   官方微博 | 高级检索  
     

基于XML的Web数据挖掘的研究
引用本文:刘振岩,王万森.基于XML的Web数据挖掘的研究[J].计算机科学,2003,30(5):42-43.
作者姓名:刘振岩  王万森
作者单位:首都师范大学信息工程学院,北京,100037
基金项目:北京市自然科学基金(4012006)
摘    要:1.引言传统的数据挖掘方法一般是针对数据库或数据仓库中的结构化数据进行的,但在现实世界中,人们面对的数据绝大部分是属于非结构化或半结构化的,例如Web页面。我们知道,Web的数据量目前至少可以用数百兆兆字节计算,且仍在迅速增长。这些数据一方面为数据挖掘提供了丰富的资源,另一方面也对数据挖掘技术提出了严峻的挑战。与传统的数据挖掘相比,实现Web数据挖掘的主要困难表现在以下三个方面:第一,Web页面缺乏统一的结构,Web上的每一个站点就

关 键 词:Web  数据挖掘  XML  数据库  数据仓库  数据源  数据管理

Research of Web Data Mining Based on XML
LIU Zhen-Yan WANG Wan-Sen.Research of Web Data Mining Based on XML[J].Computer Science,2003,30(5):42-43.
Authors:LIU Zhen-Yan WANG Wan-Sen
Abstract:The paper advances a system framework of Web data mining based on XML. This system framework integrates Information Retrieval with Information Extraction, and utilizes traditional data mining methods to complete Web data mining through XML.
Keywords:Web data mining  XML  Information retrieval  Information extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号