首页 | 本学科首页   官方微博 | 高级检索  
     

Web站点的超链结构挖掘
引用本文:阳小华.Web站点的超链结构挖掘[J].计算机工程与应用,2001,37(8):64-65.
作者姓名:阳小华
作者单位:中南工学院计算机系
摘    要:WWW是一个由成千上万个分布在世界各地的Web站点组成的全球信息系统,每个Web站点又是一个由许多Web页构成的信息(子)系统。由于一个文档作者可以通过超链把自己的文档与任意一个已知的Web页链接起来,而一个 Web站点上的信息资源又通常是由许多人共同提供的, 因此 Web站点内的超链链接通常是五花八门、各种各样的,它们可以有各种含义和用途。文章分析了WWW系统中超链的使用特征和规律,提出了一个划分超链类型、挖掘站点结构的方法,初步探讨了它在信息收集和查询等方面的应用。

关 键 词:万维网  Web站点  超链
文章编号:1002-8331-(2001)08-0064-02
修稿时间:2000年2月1日

Hyperlink Structure Mining of Web Sites
Yang Xiaohua.Hyperlink Structure Mining of Web Sites[J].Computer Engineering and Applications,2001,37(8):64-65.
Authors:Yang Xiaohua
Abstract:WWW is a global information system consisting of many Web sites around the world.Each Web site is a subsystem composed of many Web pages.There is no limitation for the writer of a WWW document to set a hyperlink pointing to any other document.Since the documents of a Web sites are often provided by more than one person,the meaning and way of hyperlinks of a Web site is various.In this paper,we analyze the characteristic of the use of hyperlinks in WWW system,present a practical method for recognizing the type of hypertext links and mining the structure of Web sites,and discuss its application on the area of information retrieval.
Keywords:World Wide Web  Web Site  Hyperlink
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号