近似网页的一种检测算法 |
| |
引用本文: | 杨文忠,彭曙蓉.近似网页的一种检测算法[J].微计算机应用,2006,27(1):22-22. |
| |
作者姓名: | 杨文忠 彭曙蓉 |
| |
作者单位: | 湖南大学电气与信息工程学院,长沙,410082 |
| |
摘 要: | 用户进行Web信息检索时,网络往往返回大量的近似网页(可看作重复网页)。针对搜索引擎查询Web信息所存在的局限性,考虑到基于关键词匹配的搜索引擎系统的特点,结合使用网页的向量空间模型,采用以下算法快速、有效地发现WWW上的重复或相似网页,提高检索效率。
|
关 键 词: | 检测算法 网页 近似 Web信息检索 搜索引擎系统 向量空间模型 检索效率 局限性 关键词 WWW |
本文献已被 维普 万方数据 等数据库收录! |
|