首页 | 本学科首页   官方微博 | 高级检索  
     

一种计算求精网页主题抽取结果的方法
引用本文:李剑,金蓓弘.一种计算求精网页主题抽取结果的方法[J].小型微型计算机系统,2004,25(3):347-351.
作者姓名:李剑  金蓓弘
作者单位:中国科学院软件所,软件工程技术中心,北京,100080
基金项目:国家重点基础研究发展规划 973项目 ( G19990 3 5 80 6)资助,国家自然科学重点基金 ( 6983 3 0 3 0 )资助
摘    要:传统的主题抽取方法单纯依靠分析网页内容的来自动获取网页主题,其分析结果并不十分精确.在WWW上,网页之间通过超链接来互相联系,而链接关系紧密的网页趋向于属于同一主题、基于这一思想,本文提出了一种利用Web链接结构信息来对主题抽取结果进行求精的方法,其通过所链接网页对本网页的影响来修正本网页的主题权值.本文还通过一个实际应用例子,分析了这一方法的特点。

关 键 词:Web信息检索  Web链接结构  主题抽取  网页  主题权值
文章编号:1000-1220(2004)03-0347-05

A Method to Amend the Web Pages' Topics Extraction Result
LI Jian,JIN Bei-hong.A Method to Amend the Web Pages'''' Topics Extraction Result[J].Mini-micro Systems,2004,25(3):347-351.
Authors:LI Jian  JIN Bei-hong
Abstract:Traditional topic extraction methods acquire web pages' topics only by analyzing the pages' content, and the analyzing results are not very accurate. In WWW, Web pages are connected with each other by hyperlinks. Web pages tightly connected with each other tend to belong to the same topics. According to this idea, this paper presents a method base on analyzing Web link structure information.It amends Web pages' topic weights according to the affections of the pages linked by these pages. Then it makes the topic extraction results more accurate. This page also analyzes this method's features by applying it to an application example.
Keywords:Web information retrieve  Web link structure  topic extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号