基于网站结构挖掘的Web文档自动分类 Automatic Web Page Categorization Based on Structure Mining of Sites期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于网站结构挖掘的Web文档自动分类

引用本文：	谢振亮,何丕廉,陈霞,孟昭鹏. 基于网站结构挖掘的Web文档自动分类[J]. 计算机应用, 2003, 23(7): 37-39

作者姓名：	谢振亮何丕廉陈霞孟昭鹏

作者单位：	天津大学,计算机科学与技术系,天津,300072

基金项目：	天津市科技发展计划项目(023100511)

摘要：	对Web文档进行人工分类可以达到准确的分类效果，但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低，文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合，并根据扩展网页的特征提取，挖掘出单个网站的分类模式，再将多个网站的分类模式进行综合，生成搜索引擎的分类模式。
关键词：	结构挖掘 Web文档自动分类分类模式扩展网页
文章编号：	1001-9081(2003)07-0037-03
修稿时间：	2003-02-18
Automatic Web Page Categorization Based on Structure Mining of Sites

Abstract:

Keywords:	structure mining automatic web page categorization classification pattern extended page
本文献已被 CNKI 维普万方数据等数据库收录！