Web网站死链检测方法 |
| |
引用本文: | 姚卓,蔡皖东,姚烨. Web网站死链检测方法[J]. 微电子学与计算机, 2012, 29(12) |
| |
作者姓名: | 姚卓 蔡皖东 姚烨 |
| |
作者单位: | 西北工业大学计算机学院,陕西西安,710129 |
| |
基金项目: | 西北工业大学基础研究基金,西北工业大学研究生创业种子基金 |
| |
摘 要: | 网站作为大规模的信息集合体,包含了大量的Web链接.有些Web链接经过一段时间之后,因种种原因而失效或者出现错误,从而形成死链.本文提出一种Web网站死链检测方法.根据Web链接的调度过程,自动获取网站链接信息;根据Web链接的结构特点和网页检索操作,对死链进行分析和检测;针对链接的相互引用问题和用户体验与页面深度的关系,对采集的数据进行预处理.实验结果表明,该方法能有效地提高死链的检测覆盖率和处理效率.
|
关 键 词: | 网站 死链检测 HTTP协议Web链接 |
Website Dead Links Detection Method |
| |
Abstract: | |
| |
Keywords: | website dead link detection HTTP protocol web links |
本文献已被 万方数据 等数据库收录! |
|