一种基于RPUC的Web文档索引库的更新算法 |
| |
引用本文: | 熊海灵 伍胜 余建桥 李航. 一种基于RPUC的Web文档索引库的更新算法[J]. 计算机科学, 2004, 31(8): 95-96 |
| |
作者姓名: | 熊海灵 伍胜 余建桥 李航 |
| |
作者单位: | 西南农业大学信息学院,重庆,400716;西南农业大学信息学院,重庆,400716;西南农业大学信息学院,重庆,400716;西南农业大学信息学院,重庆,400716 |
| |
基金项目: | 本论文得到国家自然科学基金(40731061)和重庆市教委科学技术研究项目资助. |
| |
摘 要: | 为提高搜索引擎文档索引库有效性验证的效率,本文提出了一种综合考虑网页更新频度、用户兴趣度及其内容重要程度诸因素相结合以确定文档索引库更新队列的算法。算法将用户的检索率、点击率、网页的Page Rank位和更新频度作为一个特征向量,与不同种类的网页的特征权值组成的矩阵相乘,求得网页的类型向量,依据类型向量实现对文档索引库更新队列的优化,算法改进了统一更新策略周期长、单一更新策略可能产生改变频繁而非常重要的网站长期叉得不到更新的问题。
|
关 键 词: | 搜索引擎 索引数据库 检索率 Page Rank 更新频度 点击率 |
A Refreshment Algorithm for Web Indexed Database Based on RPUC |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|
点击此处可从《计算机科学》下载全文 |
|