基于VSM主题爬虫爬行策略的研究 |
| |
引用本文: | 张锦,罗钊.基于VSM主题爬虫爬行策略的研究[J].信息通信,2014(2):37-38. |
| |
作者姓名: | 张锦 罗钊 |
| |
作者单位: | 兰州交通大学电信学院,甘肃兰州730070 |
| |
摘 要: | 网络爬虫作为搜索引擎重要的组成部分,其抓取网页资源主题相关性的高低直接决定爬虫性能的好坏。文章在VSM模型的基础上引入关键词的同义、继承、属性等关系的相关词汇来增强VSM模型的语义,通过实验进行验证,改进能够取得较好的抓取效果。
|
关 键 词: | 主题爬虫 爬行 VSM |
本文献已被 CNKI 维普 等数据库收录! |
|