首页 | 本学科首页   官方微博 | 高级检索  
     

基于加权词频的信息检索相似度评价模型
引用本文:张纯青,陈超,邵正荣,俞能海. 基于加权词频的信息检索相似度评价模型[J]. 计算机仿真, 2008, 25(1): 134-137,239
作者姓名:张纯青  陈超  邵正荣  俞能海
作者单位:中国科学技术大学电子工程与信息科学系,安徽合肥,230027;中国科学技术大学图书馆,安徽合肥,230027
基金项目:国家自然科学基金 , 微软亚洲研究院项目
摘    要:在信息检索领域,相似度评价模型是一个重要的研究课题.基本的评价模型有布尔模型,向量空间模型和概率模型.后两种模型在许多的信息检索系统中被采用,但是它们都没有考虑查询词在文档中的位置信息对相似性度量起到的作用.一些研究考虑了诸如HTML标签之类的信息,但是确定加权系数的方案不是太理想.针对这些问题,文中提出了一种基于加权词频的相似度评价模型(Weighted Term Frequency Model,WTFM),而引入的权重系数可以通过模拟退火算法学习得到.实验结果表明,权重系数的引入提高了系统的相关度评价质量.

关 键 词:信息检索  相关度评价  模拟退火算法
文章编号:1006-9348(2008)01-0134-04
收稿时间:2006-10-17
修稿时间:2007-01-19

A Relevance Evaluation Model of Information Retrieval Based on Weighted Term Frequency
ZHANG Chun-qing,CHEN Chao,SHAO Zheng-rong,YU Neng-hai. A Relevance Evaluation Model of Information Retrieval Based on Weighted Term Frequency[J]. Computer Simulation, 2008, 25(1): 134-137,239
Authors:ZHANG Chun-qing  CHEN Chao  SHAO Zheng-rong  YU Neng-hai
Affiliation:ZHANG Chun-qing YU Neng-hai Dept.of Electronic Engineering , Information Science,University of Science , Technology of China,Hefei Anhui 230027,China CHEN Chao SHAO Zheng-rong Library of University of Science , Technology of China,China
Abstract:Relevance evaluation model is an important research issue in the field of information retrieval.The bas- ic information retrieval models are boolean model,vector space model and probabilistic model.The latter two models are implemented in many retrieval systems extensively but the different position of query term in every document is ig- nored.Some researches have considered the information HTML tags but the scheme of assigning weighted parameters is not ideal.In this paper,WTFM(Weighted Term Frequency Mode...
Keywords:Information retrieval    Relevance evaluation    Simulated annealing algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号