首页 | 本学科首页   官方微博 | 高级检索  
     

基于文字链接比的网页分类的研究
引用本文:高波,张忠能,查志琴.基于文字链接比的网页分类的研究[J].计算机工程与应用,2004,40(27):151-153.
作者姓名:高波  张忠能  查志琴
作者单位:1. 上海交通大学计算机科学与工程系,上海,200030;常州工学院计算机工程系,常州,213002
2. 上海交通大学计算机科学与工程系,上海,200030
3. 常州工学院计算机工程系,常州,213002
摘    要:对于Web内容挖掘来说,对挖掘对象进行初步的识别是非常重要的,首先必须把含有具体内容的网页识别出来,才能进一步进行有效的分析。论文提出了链接比的概念,以此来分析网页的特征,然后进行有监督的学习,从而导出相关的规则,再用该规则对新的网页进行分类。

关 键 词:Hub网页  内容网页  链接比  网页分类
文章编号:1002-8331-(2004)27-0151-03

Research on Web Page Classification Based on Text Link Ratio
Gao Bo , Zhang Zhongneng Zha Zhiqin.Research on Web Page Classification Based on Text Link Ratio[J].Computer Engineering and Applications,2004,40(27):151-153.
Authors:Gao Bo  Zhang Zhongneng Zha Zhiqin
Affiliation:Gao Bo 1,2 Zhang Zhongneng 1 Zha Zhiqin 21
Abstract:To Simply Classify the Web page is very important to Web Mining.Firstly,it should identify the Web page which content s the text message.Then it can analyse the page efficiently.This paper puts forward the concept of Link Ratio,and analyzes the character of Web page with it.By supervised learning,it can extract the rule of classification.Finally,the rule can be used to classify the new Web page.
Keywords:Hub page  content  page  link rate  Web page classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号