共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
基于本体和用户相关反馈的扩展查询研究 总被引:2,自引:1,他引:1
描述了一种扩展查询(QE)的新方法,这是一种连接用户相关反馈和本体的混合扩展查询技术,有两大贡献:一是连接了用户相关反馈和本体技术,二是采用FirteX作为实验平台。与目前广泛应用的基于余弦相似性的扩展查询技术相比,实验结果表明方法平均精度达到15%,高于基于余弦相似性的扩展查询技术的13%,并且将平均反馈率提高到了16%。 相似文献
3.
《计算机科学与探索》2017,(5):814-821
传统的伪相关反馈(pseudo relevance feedback,PRF)方法,将文档作为基本抽取单元进行查询扩展,抽取粒度过大造成扩展源中噪音量的增加。研究利用主题分析技术来减轻扩展源的低质量现象。通过获取隐藏在伪相关文档集(pseudo-relevant set)各文档内容中的语义信息,并从中提取与用户查询相关的抽象主题内容作为基本抽取单元用于查询扩展。在NTCIR 8中文语料上,与传统PRF方法和基于主题模型的PRF方法相比较,实验结果表明该方法可以抽取出更符合用户查询的扩展词。此外,结果显示从更小的主题内容粒度出发进行查询扩展,可以有效提升检索性能。 相似文献
4.
5.
反馈文档的质量是制约伪相关反馈方法性能的主要因素.为了提高反馈文档的鲁棒性,提出一种基于最大边缘相关的伪相关反馈方法RMMR(Reorder Maximal Marginal Relevance).该方法通过对查询初检结果进行重调序,使得排序后的前k个文档中,文档间的相似度最小且与查询相关的数目最大.最后,利用查询纯度将影响性能的候选扩展词剔除后进行二次查询.实验结果表明,该方法可以有效地提高反馈文档的鲁棒性. 相似文献
6.
在分析当前信息检索存在问题的基础上,以及简单介绍现有相关反馈和伪相关反馈的优缺点基础上,提出一种新的首页相关反馈的查询扩展方法,并引入网页特有的特征项给出一个改进的首页相关度计算方法.在采用TREC Web Track的测试数据的实验表明,在网页查询中该算法能有效的提高查询效率,较好的克服了原有伪相关反馈的缺点. 相似文献
7.
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性. 相似文献
8.
针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、并且各文档之间相似性最小化作为排序原则,将伪相关文档集中各文档进行重排序;最后,将排序后排名靠前的文档作为扩展源进行二次反馈。实验结果表明,与两种传统伪反馈方法相比,该排序模型能获得与用户查询意图相关的反馈文档,可有效地提高检索效果。 相似文献
9.
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 总被引:13,自引:0,他引:13
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n 篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高. 相似文献
10.
基于概念图的相关反馈技术研究 总被引:2,自引:2,他引:0
相关反馈技术是信息检索技术研究的热点。目前常用的反馈技术依然是基于关键词匹配的方式,基于语义的方式缺少概念之间关系的描述。文章提出了一种基于概念图的相关反馈技术,采用概念图的知识表示方式描述概念之间关系,从语义的层次上进行相似度判断,扩展查询式。实验表明该方法可以满足用户的需求,提高检索的效率。 相似文献
11.
12.
13.
提前终止(Early Abandon)是在受限的相似搜索中的一项技术,在提高时间序列相似搜索的效率,减少冗余计算中取得成功应用.但是以往的工作中提前终止的效率往往都只是通过大量的实验测试来体现,而缺少一种理论化的方法.从理论上提出了一种对提前终止技术的实际效率的估算方法,采用统计概率的方式分析了提前终止技术在时间序列相似搜索中的效率,同时对理论结果进行了实验验证.实验结果表明,理论上的估计方法在一定程度上可以估算出提前终止的效率,为时间序列相似搜索的实际效率计算提供了理论工具. 相似文献
14.
高效时序相似搜索技术 总被引:6,自引:0,他引:6
时序相似搜索被认为是将来最有前途的技术之一.然而,时序数据是典型的高维海量数据,如何开发高效算法非常关键.文中概述了时序相似搜索技术的研究现状和进展以及研究的主要内容,讨论了该技术的几个重要应用范例,并对一些典型算法进行了定量分析;然后晕点论述了高效时序相似搜索的关键技术,包括边界过滤、三角不等式修剪、多辨析率检索方法、过滤精炼方案等.最后讨论并分析了时序的近似相似搜索技术.上述所有技术通过对比,其正面和反面都被深入分析.最后指出了存在的问题和未来的研究热点和方向. 相似文献
15.
16.
大规模时间序列数据库降维及相似搜索 总被引:4,自引:0,他引:4
提出一种基于分段多项式表示(PPR)的时间序列数据库相似查询的系统化方法.PPR是一类基于线性多项式回归的正交变换.用PPR变换索引时间序列数据在理论上具备非漏报性质.文中分析了PPR的计算复杂性以及查询阈值的下界,并提出了一种衡量时间序列相似查询算法之查询效率的定量指标.与基于离散傅立叶变换(DFT)和离散小波变换(DWT)的时间序列相似查询算法所作的对比实验表明,所提算法可以用低的索引结构维数获得高的查询效率. 相似文献
17.
18.
19.