首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
研究对等计算(P2P)信息检索系统中基于案例的查询处理策略。首先面向对等计算信息检索系统,提出了基于案例查询的概念;接着深入研究该策略的理论机制;最后阐述了该查询策略的处理过程及实现算法。  相似文献   

2.
基于P2P方式的信息检索系统相对集中式信息检索系统具有成本低、可扩展性好、容错性强等优点,可充分挖掘网络边缘资源,并可提供个性化的信息服务。本文从P2P技术的基本原理入手,围绕P2P技术的基本概念、应用范围和存在的问题进行了讨论,并着重阐述了P2P信息检索技术的原理、一般结构以及P2P模式的主要信息检索方式,并介绍了当前主流的P2P信息检索技术的研究方向和发展动态,对其未来的发展趋势和前景进行了展望。  相似文献   

3.
如何在缺少集中控制、大规模、分布式的P2P(peer-to-peer)网络中找到并定位信息是所有的P2P共享系统面临的一个难题.现有的P2P信息检索机制存在着种种不足:基于结构化P2P网络的检索效率很高,然而由于构造过于严格,难以在Internet上普及,而且仅能支持粗粒度的文件共享;非结构化P2P网络实现简单,是P2P共享系统的主要实现方式,但是由于搜索的盲目性,其检索效率又普遍低下.建立了一个新的非结构化P2P共享原型系统.该系统利用改进的蚁群算法进行检索路由,使检索总是倾向于有利的方向.同时,有针对性的推荐服务能够减少盲目搜索,提高文件共享水平.仿真实验的结果表明,该系统所采用的信息检索与信息推荐相结合的策略能够有效地提高P2P信息检索的成功率,降低网络负载.  相似文献   

4.
刘文娣  蔡明 《计算机应用与软件》2009,26(12):143-145,163
在分析以往结构化P2P基于单关键词分割的信息检索基础上,结合利用用户频繁出现的请求关键词的特点,提出结构化P2P中的一个基于请求关键词设置的索引框架KS-PIR。采用通过关键词联合的新特征项设置来扩充索引特征,并删节与特征项相关的索引记录表至恒定长度的方法,在检索质量提高的同时,又保证了可接受的带宽消耗,系统具有很好的扩展性。  相似文献   

5.
《软件工程师》2019,(2):5-10
对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的三种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。  相似文献   

6.
为解决P2P社区的资源定位及信息检索问题,采用混合型P2P网络模型,将社区内的检索划分为本地检索、组内搜索和组间搜索。对于本地检索设计了新的词条权重的计算方法,解决了同构文档集内的文本检索问题。对于组内搜索和组间搜索,通过设计节点选择策略,使一部分与查询相关度高的节点执行查询任务。最后提出结果融合的方法并对特定的实验数据进行测试,实验表明设计的算法在较小的查询开销下,能取得较好的检索效果。  相似文献   

7.
魏珂  任建华  孟样福 《计算机科学》2012,39(10):164-169
提出了一种基于XML小枝查询片段松弛的近似查询与结果排序方法来实现用户在XML文档中的近似查询:通过收集用户的查询历史来推测用户偏好,并以此计算原始小枝查询分解得到的查询片段的重要程度,然后按照重要程度的排序进行查询松弛;在松弛方法中,根据查询片段数目的不同采用不同的松弛方法,若片段数目较多则以查询片段为粒度对其松弛,较少则以查询结点为粒度对数值查询与非数值查询采用不同的方法进行松弛,得到最为相关的近似查询结果;最后按近似查询结果对原始查询和用户偏好的满足程度进行排序并输出。实验证明,该近似查询方法能够较好地满足用户的需求和偏好,具有较高的查全率和准确率。  相似文献   

8.
王丹 《计算机科学》2004,31(9):57-59
随着计算机网络的迅速发展和个人计算机处理能力的不断提高,P2P技术已高度重视其新的特性。但是,P2P系统的高度动态性和资源的广泛分布性使其难以共享资源。本文讨论了P2P系统的资源查询机制,描述和分析了一些方法,给出了查询机制的要求和目标。  相似文献   

9.
在分析了现有数字图书馆现状和对等网(P2P)拓扑结构的特点上,将动态的、易维护的、可扩展的、鲁棒性强的P2P网络运用到数字图书馆中,设计了一个基于P2P的数字图书馆信息检索模型,简要介绍了模型系统的功能,并针对构建过程中存在的问题引入均衡负载,自我调节和心跳策略来解决。最后,用模拟实验验证了其有效性和可用性。  相似文献   

10.
XML关键字查询结果质量不高的一个很重要的原因是查询关键词难以反映用户真实的查询意图,而给关键词设置权重在一定程度上可以解决这一难题. 本文结合关键字之间的结构关系提出了一种新的结果排序方法,该方法给查询关键词设置权重,并参照查询关键词的权重给包含关键字的结点设定结点权重,然后根据关系树中的结点权重和关键词之间结构关系[1]统计SLCA结点的重要程度,再以此依据对查询结果进行排序,最后返回给用户有序的查询结果. 实验结果和分析表明,提出的排序方法具有较高的准确率,能够较好地满足用户查询的需求和偏好.  相似文献   

11.
针对对等网络中检索结果的重复问题,提出一种检索结果合并策略。介绍一种重复文档检测方法,对于重复文档,采用以减少下载数据量和下载响应时间为目的的下载节点选择方法及合并算法,有效减少检索结果的冗余度、下载数据的网络传输量和获取数据的响应时间。实验验证了该方法的有效性。  相似文献   

12.
We present a new approach based on neural networks to solve the merging strategy problem for Cross-Lingual Information Retrieval (CLIR). In addition to language barrier issues in CLIR systems, how to merge a ranked list that contains documents in different languages from several text collections is also critical. We propose a merging strategy based on competitive learning to obtain a single ranking of documents merging the individual lists from the separate retrieved documents. The main contribution of the paper is to show the effectiveness of the Learning Vector Quantization (LVQ) algorithm in solving the merging problem. In order to investigate the effects of varying the number of codebook vectors, we have carried out several experiments with different values for this parameter. The results demonstrate that the LVQ algorithm is a good alternative merging strategy.  相似文献   

13.
Geographic Information Retrieval is concerned with retrieving documents in response to a spatially related query. This paper addresses the ranking of documents by both textual and spatial relevance. To this end, we introduce multi-dimensional scattered ranking, where textually and spatially similar documents are ranked spread in the list, instead of consecutively. The effect of this is that documents close together in the ranked list have less redundant information. We present various ranking methods of this type, efficient algorithms to implement them, and experiments to show the outcome of the methods.*This research is supported by the EU-IST Project No. IST-2001-35047 (SPIRIT).  相似文献   

14.
多查询相关的排序支持向量机融合算法   总被引:3,自引:1,他引:2  
排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提出一种基于有监督学习的融合多个与查询相关排序子模型的方法.该方法为每一个查询及其相关文档建立一个子排序模型,并将子排序模型的输出进行向量化表示,将多个查询相关的排序模型转化为体现查询差异的特征数据,实现多排序模型的集成.以排序支持向量机为例,在查询级和样本级建立新的损失函数作为优化目标,并利用此损失函数调节不同查询产生损失之间的权重,提出多查询相关的排序支持向量机融合算法.在文档检索和网页检索中的实验结果表明,使用多查询相关的排序支持向量机融合算法可以取得比传统排序学习模型更好的性能.  相似文献   

15.
We present a statistical method called Covering Topic Score (CTS) to predict query performance for information retrieval. Estimation is based on how well the topic of a user's query is covered by documents retrieved from a certain retrieval system. Our approach is conceptually simple and intuitive, and can be easily extended to incorporate features beyond bag- of-words such as phrases and proximity of terms. Experiments demonstrate that CTS significantly correlates with query performance in a variety of TREC test collections, and in particular CTS gains more prediction power benefiting from features of phrases and proximity of terms. We compare CTS with previous state-of-the-art methods for query performance prediction including clarity score and robustness score. Our experimental results show that CTS consistently performs better than, or at least as well as, these other methods. In addition to its high effectiveness, CTS is also shown to have very low computational complexity, meaning that it can be practical for real applications.  相似文献   

16.
历经几十年的发展,多媒体检索取得了长足的进步,然而检索性能的提升依然受到“意图鸿沟”与“语义鸿沟”的制约.针对此问题,学术界提出了一系列查询技术帮助用户清楚地表达检索意图以及反馈技术帮助系统准确地理解用户意图与媒体数据,有效提升了检索性能.对多媒体检索中的查询与反馈技术进行了分析与讨论.分析了查询方式的演变与反馈技术的发展,综述了面向PC机、移动智能终端、触屏设备的查询技术,介绍了不同时期的反馈技术,探讨了探索式搜索中的交互问题,最后分析了该领域的未来研究趋势.  相似文献   

17.
非结构化P2P网络实现简单,是P2P信息共享系统的研究热点,但其存在搜索盲目、检索效率低的不足。针对其存在的问题,本文提出将改进的蚁群算法引入其中,构建了基于蚁群算法的P2P信息检索,使检索总是倾向于有利的方向;同时,有针对性的推荐服务能够减少盲目搜索,进一步提高信息定位效率。仿真结果表明,该系统所采用的信息检索与信息推荐相结合的策略能够有效地提高非结构化P2P信息检索的成功率,降低网络负载。  相似文献   

18.
郎皓  王斌  李锦涛  丁凡 《软件学报》2008,19(2):291-300
目前,查询性能预测(predicting query performance,简称PQP)已经被认为是检索系统最重要的功能之一.近几年的研究和实验表明,PQP技术在文本检索领域有着广阔的发展前景和拓展空间.对文本检索中的PQP进行综述,重点论述其主要方法和关键技术.首先介绍了常用的实验语料和评价体系;然后介绍了影响查询性能的各方面因素;之后,按照基于检索前和检索后的分类体系概述了目前主要的PQP方法;简介了PQP在几个方面的应用;最后讨论了PQP所面临的一些挑战.  相似文献   

19.
近年来,时空数据查询方法的研究成为人们普遍关注的研究热点.但大部分研究主要集中在集中式环境,在分布式环境下对海量时空数据进行高效的轨迹查询和窗口查询是一件十分有意义且具有挑战性的工作.设计了一种基于P2P的解决方案,提出了对移动对象运动空间进行双层划分的方法来同时支持两种查询.应用网格过滤技术有效地解决了数据频繁更新的问题.对运动空间进行高效的划分,具有比空间填充曲线方法更好的负载平衡性,同时设计了高效的Overlay--SmartChord来支持窗口查询.实验结果表明,和现有方案相比所提方案可以有效减少更新通信量,负载平衡性和路由效率有显著提高.  相似文献   

20.
一种基于局部共现的查询扩展方法   总被引:16,自引:2,他引:16  
针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local Context Analysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号