基于网站结构挖掘的Web文档自动分类 |
| |
引用本文: | 谢振亮,何丕廉,陈霞,孟昭鹏. 基于网站结构挖掘的Web文档自动分类[J]. 计算机应用, 2003, 23(7): 37-39 |
| |
作者姓名: | 谢振亮 何丕廉 陈霞 孟昭鹏 |
| |
作者单位: | 天津大学,计算机科学与技术系,天津,300072 |
| |
基金项目: | 天津市科技发展计划项目(023100511) |
| |
摘 要: | 对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。
|
关 键 词: | 结构挖掘 Web文档自动分类 分类模式 扩展网页 |
文章编号: | 1001-9081(2003)07-0037-03 |
修稿时间: | 2003-02-18 |
Automatic Web Page Categorization Based on Structure Mining of Sites |
| |
Abstract: | |
| |
Keywords: | structure mining automatic web page categorization classification pattern extended page |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|