期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈飞刘奕群张敏马少平《软件学报》2015,26(12):3130-3139

多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都忽略了查询子意图的类型信息;而不同类型的查询子意图对信息需求具有不同的特点.首先,通过引入衰减函数对这种特点进行描述,进而对用户子意图的分类方法进行抽象;在此基础上,提出了利用查询子意图类型信息进行多样化检索结果评测的框架,该框架定义了利用查询子意图类型信息进行多样化检索评测的方法应该具有的结构;然后,讨论了在用信息类和导航类作为子意图分类方法的前提下,其对应的衰减函数的形式;最后,在TREC与NTCIR测试集上的实验结果表明了所提出方法的有效性. 相似文献

2.

863信息检索评测--自动化所

吕碧波王根赵军《中文信息学报》2006,20(Z1):78-82

本文主要介绍我们参加863信息检索评测的情况.我们的信息检索系统采用基于语言模型的信息检索方法,将命名实体技术运用在查询向量的构造中,利用基于链接分析的PageRank算法计算文档的先验概率,并在自动查询中采用了相关反馈技术.文章还介绍了系统构成的软硬件环境及相关评测数据,给出了对待自动查询和人工查询的不同策略,并通过实验结果的比较,分析了中文信息检索中比较有效的方法,最后给出了系统存在的不足以及今后改进的方向. 相似文献

3.

知识网格中基于领域本体的智能检索

胡艳丽白亮张维明肖卫东汤大权《计算机科学》2007,34(8):202-207

本文提出知识网格环境下基于领域本体的智能检索模型,采用OWL DL语言对领域知识进行形式化描述,支持推理和深层语义检索.＂标注＂和＂查询优化＂是检索的两个关键技术.通过规范的概念和概念间语义关系对文档片段进行标注,并针对＂一词多义＂问题提出＂主题-概念＂两阶段消歧算法.＂查询优化＂过程中,基于OWL DL推理的优化算法实现查询概念的自动扩展,提高了查全率和查准率.基于以上方法,建立航天领域本体,利用网上数据库开放资源作为测试集进行评测.实验显示,与传统基于相似文献

4.

基于链接的方法进行Web信息检索的TREC实验研究 总被引：1，自引：0，他引：1

张敏马少平高剑锋《中文信息学报》2003,17(1):20-24,31

本文通过TREC实验研究基于链接信息的检索对Web信息检索的影响,包括使用链接描述文本,链接结构以及将基于链接的方法和传统基于内容检索的方法合并。得到如下结论:首先,链接描述文档对网页主题的概括有高度的精确性,但是对网页内容的描述有极大的不完全性;其次,与传统检索方法相比,使用链接文本在网页定位的任务上能够使系统性能提高96% ,但是在信息查询任务上没有帮助;最后,将基于链接信息的检索与传统的基于内容检索技术合并,在网页入口定位任务上总能将系统性能提高48%到124.8% ,而对特定信息查询任务也能在一定程度上改善检索效果。相似文献

5.

机器学习的查询扩展在博客检索中的应用 总被引：1，自引：0，他引：1

王秉卿张奇吴立德黄萱菁《中文信息学报》2008,22(6):98-102

该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理论。通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能。对于输入的查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项。由于训练这个支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生成训练数据。这套查询扩展方法的优点在于通过对训练语料的学习,能够对候选扩展词作出更合理的选择。在TREC评测会议组织的观点检索任务中,相对于不采用任何扩展技术的基准系统,该方法提高了MAP指标33.1%。相似文献

6.

2005年863网页检索ICST评测报告 总被引：1，自引：0，他引：1

程羽心路斌刘缙杨建武马龙《中文信息学报》2006,20(Z1):102-106

2005年863评测任务是在CWT100G这个90G的数据集上检索相关网页.评测给出了50个包含title、desc、narr的主题,要求根据这些主题自动和人工生成查询.ICST在这次评测中使用了倒排索引技术给数据集建索引,通过给多个查询调整权重和多个文档查询域调整权重的方法,综合给出网页的得分.2005年的评测结果显示,排在最前的一些网页大部分是相关网页,前10个结果的准确率超过了50%,召回率也达到了30%以上.评测结果也表明,手工选词生成查询的结果要优于自动生成的查询. 相似文献

7.

MXDR:一种基于关键字的XML多文档分布式检索方法

下载免费PDF全文

李霞李战怀张利军陈群李宁《计算机科学与探索》2011,38(10)

基于关键字的XML检索技术是近几年信息检索领域的研究热点.但是由于关键字缺少XML结构语义信息,检索结果和用户需求偏差较大,检索质量难以提高;而XML结构检索由于用户难以提出准确描述查询意图的查询表达式而难以普及.另一个更突出的问题是现有的XML检索研究绝大多数都集中在单文档上,缺乏实用性.因此提出一种基于关键字的结构检索方法,即用分布式方式实现对多XML文档的检索,简称为MXDR(Multi-XML Distributed Retrieval).MXDR首先用一种兼顾结构和内容的聚类方法对多文档进行分类,通过分析查询关键字和类别结构信息,确定分布查找策略,再结合查询关键字和XML的结构信息,构建结构查询语句,最后通过结构查询系统实现关键字检索.在多组真实数据Sigmod数据集上的验证结果表明,与经典的SLCA方法比较,MXDR方法具有较高的查全率和查准率,尤其在检索效率上MXDR方法有显著优势. 相似文献

8.

提高检索性能的朝鲜语布尔查询词生成及扩展

金光赫王兴伟曲大鹏《小型微型计算机系统》2013,34(5)

为了提高信息检索系统的检索性能,同时方便用户的操作,本文提出一种新的方法将用户输入的朝鲜自然语句自动转换成扩展的布尔查询词.首先基于句法信息将用户输入的朝鲜自然语句生成布尔查询词,然后对查询词进行句法分析,利用句法树组合或分离结构上相互联系的复合名词,并以扩展多样标记和简略标记用语扩展检索.同普通的检索方法和手动提取布尔查询词检索方法相比,本文提出的方法在准确率上分别高出8％和12％. 相似文献

9.

S-CBR:基于数据库模式展现数据库关键词检索结果

彭朝晖张俊王珊《软件学报》2008,19(2):323-337

提出一种基于数据库模式的数据库关键词检索结果展现方法S-CBR(schema-based classification,browsing and retrieving),包括结果分类、用户浏览和再次检索3个过程.S-CBR首先利用数据库模式和查询关键词自动产生第一级类别,将检索结果分配到各个类中;对于比较大的类,按关键词节点内容进行第二级分类;另外赋给每个类别一个类别描述,并将类别描述和每个结果图形化地展现出来,使用户容易阅读和理解检索结果.用户还可以根据S-CBR提供的结果类别模式信息对感兴趣的类别作进一步检索,以尽快找到所需结果或获取更多的相关结果.实验证明了S-CBR方法的有效性. 相似文献

10.

基于文档团的Markov网络检索模型

汤皖宁王明文万剑怡《计算机研究与发展》2014,51(10)

查询扩展是提高检索效率的有效方法.但是许多查询扩展方法中扩展词的选择没有充分考虑词项之间以及词项与文档之间的相关性,这样可能在查询扩展时加入太多不相关信息降低检索的性能.通过对文档间相关性和词间相关性的计算,把文档和词关联起来构建Markov网络检索模型,然后根据词项子空间和文档子空间的映射关系提取词团,将提取的词团信息用于查询扩展,使得查询扩展的内容更为相关.实验表明:基于文档团依赖的Markov检索模型能有效地提高检索效果. 相似文献