首页 | 本学科首页   官方微博 | 高级检索  
     

近似网页的一种检测算法
引用本文:杨文忠,彭曙蓉.近似网页的一种检测算法[J].微计算机应用,2006,27(1):22-22.
作者姓名:杨文忠  彭曙蓉
作者单位:湖南大学电气与信息工程学院,长沙,410082
摘    要:用户进行Web信息检索时,网络往往返回大量的近似网页(可看作重复网页)。针对搜索引擎查询Web信息所存在的局限性,考虑到基于关键词匹配的搜索引擎系统的特点,结合使用网页的向量空间模型,采用以下算法快速、有效地发现WWW上的重复或相似网页,提高检索效率。

关 键 词:检测算法  网页  近似  Web信息检索  搜索引擎系统  向量空间模型  检索效率  局限性  关键词  WWW
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号