首页 | 本学科首页   官方微博 | 高级检索  
     

基于网站结构挖掘的Web文档自动分类
引用本文:谢振亮,何丕廉,陈霞,孟昭鹏. 基于网站结构挖掘的Web文档自动分类[J]. 计算机应用, 2003, 23(7): 37-39
作者姓名:谢振亮  何丕廉  陈霞  孟昭鹏
作者单位:天津大学,计算机科学与技术系,天津,300072
基金项目:天津市科技发展计划项目(023100511)
摘    要:对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。

关 键 词:结构挖掘 Web文档自动分类 分类模式 扩展网页
文章编号:1001-9081(2003)07-0037-03
修稿时间:2003-02-18

Automatic Web Page Categorization Based on Structure Mining of Sites
Abstract:
Keywords:structure mining  automatic web page categorization  classification pattern  extended page
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号