首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
信息检索的效果很大程度上取决于用户能否输入恰当的查询来描述自身信息需求。很多查询通常简短而模糊,甚至包含噪音。查询推荐技术可以帮助用户提炼查询、准确描述信息需求。为了获得高质量的查询推荐,在大规模“查询-链接”二部图上采用随机漫步方法产生候选集合。利用摘要点击信息对候选列表进行重排序,使得体现用户意图的查询排在比较高的位置。最终采用基于学习的算法对推荐查询中可能存在的噪声进行过滤。基于真实用户行为数据的实验表明该方法取得了较好的效果。  相似文献   

2.
针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量。将查询意图识别视为一个分类问题,分析搜狗查询日志发现:信息事务类查询串点击的不同页面数较多,分布呈现多极值性;导航类查询串点击的不同页面数较少,分布呈现单极值性;导航类查询结果中,子页面噪声对查询分类结果产生严重干扰。根据以上特点,提出"不同页面点击数"、"点击分布值"和"异源页面点击数"三个特征,并结合前人研究,利用C4.5算法训练分类器,进行查询意图识别。实验结果中查询分类的整体正确率达到90%,与Baseline相比,提高了8.5%。结果表明,该方法对识别用户查询意图是有效的。  相似文献   

3.
用户查询意图模型是查询扩展和查询推荐研究中的一个热点。然而,日志包含的大量噪声对主流的用户查询意图模型构建过程具有较大负面影响。观察日志发现,用户试探性点击是日志噪声的一个主要来源。由此,基于试探性点击的特征提出了一种融合用户学习过程的用户查询意图模型。该模型对用户从试探性点击中学习到的经验进行建模,并基于用户学习到的经验对试探性点击进行识别和过滤。一系列实验结果表明,该模型在日志噪声较高的情况下能够有效过滤试探性点击产生的噪声,提高用户查询意图描述的准确率。将该模型应用于查询推荐后,能有效提高查询条件间的相似性计算结果,并提高查询推荐结果的准确率。  相似文献   

4.
用户查询意图是指用户在构建查询时,希望搜索引擎能够返回的信息.如果搜索引擎可以判断用户当前查询与之前输入的查询是否属于同一查询意图,那么可以为用户提供更适当的查询建议、查询扩展或者个性化检索服务等.该文提出了基于点击相似度切分用户查询意图,在决策树模型和CRF模型上都取得了一定的提升.利用用户点击信息可以提高查询意图切分的效果,引入用户点击信息后,基于决策树的方法,F值提高1%,基于CRF模型的F值提高1.4%.  相似文献   

5.
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容。文中提出一种融合多类特征识别Web查询意图的方法。将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征。在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88。5%的测试查询获得准确的意图识别结果。  相似文献   

6.
基于查询意图的长尾查询推荐   总被引:1,自引:0,他引:1  
查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推荐会受到查询中噪声单词的影响.该文提出了一种新的关于词项查询图(term-query graph)概率混合模型,该模型能够准确地发掘出用户的查询意图.另外,文中还提出了一种融合查询意图的查询推荐方法,该方法可以将新查询中单词的推荐结果按查询意图自然地融合起来,从而避免了噪声单词对推荐结果的影响.实验结果表明,通过考虑查询意图,可以显著提高长尾查询推荐的相关性.  相似文献   

7.
为了提高搜索引擎查询结果的质量,越来越关注于对用户提交的网络查询意图的识别。基于查询session对用户提交的查询进行多维度特征提取,尽量能全面系统地描述查询分类特征,并使用SVM进行分类。实验结果表明通过结合查询的多个特征有助于识别查询意图,在人工标注的测试集中对查询意图分类的正确率达到80%。  相似文献   

8.
《计算机工程》2017,(3):181-186
以特征模板为主的查询意图识别方法存在人工抽取特征繁琐,并且难以捕捉文本语义信息的问题。为此,基于字符级循环网络,提出一种新的查询意图识别模型。为能有效提取句子深层次语义特征,减少长距离信息依赖的限制,使用长短时记忆网络(LSTM)作为神经网络线性变换层,同时增加一层反向LSTM抽取字符的将来信息特征。使用原始汉字直接作为模型的输入,避免分词结果不准确带来的错误传导问题,利用字符的分布向量表示方法,提高句子语义特征的获取。实验结果表明,该方法整体准确率达到90.7%,相比特征模板方法有所提升,能提高用户查询意图的分类性能。  相似文献   

9.
基于XML的实时Web GIS优化模型的研究   总被引:6,自引:1,他引:6  
XML是由W3C组织将SGML标准进行简化形成的置标语言。SVG是由W3C组织开发的一种开放标准的文本式矢量图形描述语言,是XML的一个子集。将XML/SVG与GIS系统Web发布相结合,提出了一个基于XML的实时Web GIS优化模型,对关键技术及解决方案进行了详细剖析。实例证实,所用技术手段具有良好的实际应用表现优于各种传统技术,扩展了XML的应用领域,同时也为GIS发布提供了一个先进的体系模型。  相似文献   

10.
王大玲  于戈  鲍玉斌  张沫  沈洲 《软件学报》2010,21(1):1083-1097
基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的 Web 网页动态泛化模型,为搜索的Web 网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次, 通过网页内容、类型和格式的泛化为不同的访问意图提供进一步的搜索导航,从而返回与搜索意图更相关的结果. 与相关工作对比,重点并非获取用户意图,也不是对用户意图分类,而是基于用户搜索意图的Web 网页动态泛化模型 的建立及Web 网页泛化过程的实现.实验结果表明,该泛化模型不仅能够通过导航自动获取用户搜索意图,而且能够 基于该意图提供相关搜索结果以及进一步的搜索导航.  相似文献   

11.
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用.传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不利影响.提出了一种基于分类模型的查询扩展方法,该算法综合候选扩展词的统计信息和多种特征,采用朴素贝叶斯分类模型对初次得到的候选扩展词进行再次分类选择,进一步去除与查询词相关性小的扩展词.在TREC 2013数据集上的实验结果表明,提出的查询扩展方法能够有效提高用户查询的查准率和查全率.  相似文献   

12.
针对现有信息检索系统难以按查询需求处理检索文档的问题,提出了一种基于相关反馈的信息检索模型,分析了查询词分解,推导了相关反馈机制和正规化过程,并进一步阐述了文档提取方法。提出的模型通过相关反馈和查询词扩展,克服了传统方法无法计算文档与查询词之间的相似度问题,并能有效地处理检索文档。仿真结果证明了该模型的有效性和可行性。  相似文献   

13.
基于改进向量空间模型的Web信息检索技术研究   总被引:12,自引:1,他引:12  
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

14.
基于查询术语同义词的扩展信念网络检索模型   总被引:1,自引:0,他引:1       下载免费PDF全文
针对信念网络模型没有考虑术语之间关系的缺陷,引入了查询同义词的概念,提出了一个基于查询术语同义词的扩展信念网络检索模型。给出了模型的拓扑结构,讨论了利用新模型进行信息检索的方法,并给出了一个实用案例。新模型同时考虑了用户查询术语及其同义词的作用,提高了检索性能。  相似文献   

15.
P2P信息检索及其优化策略   总被引:4,自引:0,他引:4  
本文研究对等计算(P2P)环境中语义丰富的信息检索及其优化策略,提出了P2P信息检索系统(PIRS),实现了P2P环境中语义丰富的信息检索,定义了一套评价PIRS效率的指标体系;明确了决定PIRS效率的关键因素并提出相应的解决策略,包括:基于向量空间模型的节点数据分类管理策略、基于节点聚类的系统数据管理策略以及自适应查询路由策略,并用实验结果验证了这些策略的有效性。  相似文献   

16.
本文讨论了云模型的基本概念和相联规则的含义.从应用的角度提出一种新的相联规则智能信息获取方法CM-T,并给出了算法的步骤和度量标准.由于云模型较好地软化了数量属性论域的划分边界,从而为进一步满足Web信息检索提供一种个性化的高效信息检索工具.  相似文献   

17.
数据库的查询优化研究   总被引:1,自引:0,他引:1  
在以数据库为核心的应用系统中,查询操作最为频繁,实现快速查询将直接影响数据库应用系统的性能。正确地理解和恰当地使用索引可以在数据库中实现快速的数据查询。  相似文献   

18.
良好的缓存管理机制以及合理的缓存应用模式往往是系统性能提升的关键。而查询性能是一个系统性能表现的重要方面。文章在深入研究Hibernate的缓存机制以及二级缓存的应用策略的同时,提出了两种基于该缓存机制的系统查询性能优化方法。应用结果表明,通过这两种方法系统性能得到了相应的提高。  相似文献   

19.
良好的缓存管理机制以及合理的缓存应用模式往往是系统性能提升的关键.而查询性能是一个系统性能表现的重要方面.文章在深入研究Hibernate的缓存机制以及二级缓存的应用策略的同时,提出了两种基于该缓存机制的系统查询性能优化方法.应用结果表明,通过这两种方法系统性能得到了相应的提高.  相似文献   

20.
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列提取能反映数据变化趋势的特征极值点,然后仅对特征极值点进行相似查询,极大减少了数据存储量,提高了查询计算速度。该算法经实验验证切实有效可行,相对其它算法能明显提高查询速度和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号