首页 | 本学科首页   官方微博 | 高级检索  
     

信息检索中的带权邻近度度量研究
引用本文:薛源海,俞晓明,刘悦,关峰,程学旗.信息检索中的带权邻近度度量研究[J].计算机研究与发展,2014,51(10).
作者姓名:薛源海  俞晓明  刘悦  关峰  程学旗
作者单位:1. 中国科学院网络数据科学与技术重点实验室 北京 100190;中国科学院计算技术研究所 北京 100190;中国科学院大学 北京100190
2. 中国科学院网络数据科学与技术重点实验室 北京 100190;中国科学院计算技术研究所 北京 100190
基金项目:国家自然科学基金项目,国家“八六三”高技术研究发展计划基金项目
摘    要:信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.

关 键 词:带权邻近度  度量方法  BM  查询词重要性  信息检索

Exploration of Weighted Proximity Measure in Information Retrieval
Xue Yuanhai,Yu Xiaoming,Liu Yue,Guan Feng,Cheng Xueqi.Exploration of Weighted Proximity Measure in Information Retrieval[J].Journal of Computer Research and Development,2014,51(10).
Authors:Xue Yuanhai  Yu Xiaoming  Liu Yue  Guan Feng  Cheng Xueqi
Abstract:
Keywords:weighted proximity  measure method  BM25  term significance  information retrieval
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号