首页 | 本学科首页   官方微博 | 高级检索  
     

Web数据挖掘研究与探讨
引用本文:曼丽春,朱宏,杨全胜.Web数据挖掘研究与探讨[J].现代电子技术,2005,28(8):3-6.
作者姓名:曼丽春  朱宏  杨全胜
作者单位:四川大学,计算机学院,四川,成都,610065
摘    要:随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。

关 键 词:数据挖掘  Web数据  信息提取  XML
文章编号:1004-373X(2005)08-003-04
修稿时间:2004年12月28

Research and Discussion of Web Data Mining
MAN Lichun,ZHU Hong,YANG Quansheng.Research and Discussion of Web Data Mining[J].Modern Electronic Technique,2005,28(8):3-6.
Authors:MAN Lichun  ZHU Hong  YANG Quansheng
Abstract:With the rapid development of World Wide Web and the radical expansion of information, how to find the contents that really interest the end users in the vast amount of data has turned to be the focus of recent researches in data management and webrelated areas. Web Data Mining, because of the semistructured data feature, is more difficult and quite different from the traditional databasebased data mining. In order to alleviate the situation, the theory and technology of data mining is introduced to WWW, which ultimately becomes a fresh area Web Data Mining (WDM). Web Data Mining includes the data mining of Web content, Web structure, Web usage. This paper surveys the theory and practice of Web Data Mining, together with a new technology of XML, applying to Web Data Mining realization. More researches must be done on how to explore Web Data Mining deeply and make good use of Web resource. The research of Web Data Mining will meet with a lot of challenges, but on the other hand the research has great potential.
Keywords:data mining  Web data  information extraction  XML
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号