共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
《计算机应用与软件》2015,(11)
针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量。将查询意图识别视为一个分类问题,分析搜狗查询日志发现:信息事务类查询串点击的不同页面数较多,分布呈现多极值性;导航类查询串点击的不同页面数较少,分布呈现单极值性;导航类查询结果中,子页面噪声对查询分类结果产生严重干扰。根据以上特点,提出"不同页面点击数"、"点击分布值"和"异源页面点击数"三个特征,并结合前人研究,利用C4.5算法训练分类器,进行查询意图识别。实验结果中查询分类的整体正确率达到90%,与Baseline相比,提高了8.5%。结果表明,该方法对识别用户查询意图是有效的。 相似文献
3.
用户查询意图模型是查询扩展和查询推荐研究中的一个热点。然而,日志包含的大量噪声对主流的用户查询意图模型构建过程具有较大负面影响。观察日志发现,用户试探性点击是日志噪声的一个主要来源。由此,基于试探性点击的特征提出了一种融合用户学习过程的用户查询意图模型。该模型对用户从试探性点击中学习到的经验进行建模,并基于用户学习到的经验对试探性点击进行识别和过滤。一系列实验结果表明,该模型在日志噪声较高的情况下能够有效过滤试探性点击产生的噪声,提高用户查询意图描述的准确率。将该模型应用于查询推荐后,能有效提高查询条件间的相似性计算结果,并提高查询推荐结果的准确率。 相似文献
4.
用户查询意图是指用户在构建查询时,希望搜索引擎能够返回的信息.如果搜索引擎可以判断用户当前查询与之前输入的查询是否属于同一查询意图,那么可以为用户提供更适当的查询建议、查询扩展或者个性化检索服务等.该文提出了基于点击相似度切分用户查询意图,在决策树模型和CRF模型上都取得了一定的提升.利用用户点击信息可以提高查询意图切分的效果,引入用户点击信息后,基于决策树的方法,F值提高1%,基于CRF模型的F值提高1.4%. 相似文献
5.
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容。文中提出一种融合多类特征识别Web查询意图的方法。将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征。在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88。5%的测试查询获得准确的意图识别结果。 相似文献
6.
基于查询意图的长尾查询推荐 总被引:1,自引:0,他引:1
查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推荐会受到查询中噪声单词的影响.该文提出了一种新的关于词项查询图(term-query graph)概率混合模型,该模型能够准确地发掘出用户的查询意图.另外,文中还提出了一种融合查询意图的查询推荐方法,该方法可以将新查询中单词的推荐结果按查询意图自然地融合起来,从而避免了噪声单词对推荐结果的影响.实验结果表明,通过考虑查询意图,可以显著提高长尾查询推荐的相关性. 相似文献
7.
为了提高搜索引擎查询结果的质量,越来越关注于对用户提交的网络查询意图的识别。基于查询session对用户提交的查询进行多维度特征提取,尽量能全面系统地描述查询分类特征,并使用SVM进行分类。实验结果表明通过结合查询的多个特征有助于识别查询意图,在人工标注的测试集中对查询意图分类的正确率达到80%。 相似文献
8.
9.
基于XML的实时Web GIS优化模型的研究 总被引:6,自引:1,他引:6
XML是由W3C组织将SGML标准进行简化形成的置标语言。SVG是由W3C组织开发的一种开放标准的文本式矢量图形描述语言,是XML的一个子集。将XML/SVG与GIS系统Web发布相结合,提出了一个基于XML的实时Web GIS优化模型,对关键技术及解决方案进行了详细剖析。实例证实,所用技术手段具有良好的实际应用表现优于各种传统技术,扩展了XML的应用领域,同时也为GIS发布提供了一个先进的体系模型。 相似文献
10.
基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的
Web 网页动态泛化模型,为搜索的Web 网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次,
通过网页内容、类型和格式的泛化为不同的访问意图提供进一步的搜索导航,从而返回与搜索意图更相关的结果.
与相关工作对比,重点并非获取用户意图,也不是对用户意图分类,而是基于用户搜索意图的Web 网页动态泛化模型
的建立及Web 网页泛化过程的实现.实验结果表明,该泛化模型不仅能够通过导航自动获取用户搜索意图,而且能够
基于该意图提供相关搜索结果以及进一步的搜索导航. 相似文献
11.
查询扩展作为查询优化的重要组成部分,对改善信息检索系统的性能起到了至关重要的作用.传统的伪相关反馈查询扩展方法虽然在一定程度上提高了检索性能,但选择的扩展词中会包含一部分与原查询不相关的词语,这对检索性能的提升产生了不利影响.提出了一种基于分类模型的查询扩展方法,该算法综合候选扩展词的统计信息和多种特征,采用朴素贝叶斯分类模型对初次得到的候选扩展词进行再次分类选择,进一步去除与查询词相关性小的扩展词.在TREC 2013数据集上的实验结果表明,提出的查询扩展方法能够有效提高用户查询的查准率和查全率. 相似文献
12.
13.
14.
15.
P2P信息检索及其优化策略 总被引:4,自引:0,他引:4
本文研究对等计算(P2P)环境中语义丰富的信息检索及其优化策略,提出了P2P信息检索系统(PIRS),实现了P2P环境中语义丰富的信息检索,定义了一套评价PIRS效率的指标体系;明确了决定PIRS效率的关键因素并提出相应的解决策略,包括:基于向量空间模型的节点数据分类管理策略、基于节点聚类的系统数据管理策略以及自适应查询路由策略,并用实验结果验证了这些策略的有效性。 相似文献
16.
17.
数据库的查询优化研究 总被引:1,自引:0,他引:1
在以数据库为核心的应用系统中,查询操作最为频繁,实现快速查询将直接影响数据库应用系统的性能。正确地理解和恰当地使用索引可以在数据库中实现快速的数据查询。 相似文献
18.
良好的缓存管理机制以及合理的缓存应用模式往往是系统性能提升的关键。而查询性能是一个系统性能表现的重要方面。文章在深入研究Hibernate的缓存机制以及二级缓存的应用策略的同时,提出了两种基于该缓存机制的系统查询性能优化方法。应用结果表明,通过这两种方法系统性能得到了相应的提高。 相似文献
19.
良好的缓存管理机制以及合理的缓存应用模式往往是系统性能提升的关键.而查询性能是一个系统性能表现的重要方面.文章在深入研究Hibernate的缓存机制以及二级缓存的应用策略的同时,提出了两种基于该缓存机制的系统查询性能优化方法.应用结果表明,通过这两种方法系统性能得到了相应的提高. 相似文献
20.
为实现对数据库信息查询时使用自然语言与计算机交流,提出了一种智能查询优化算法-IIOP算法;首创提出将模糊查询与相似查询结合的思想,其中模糊匹配查询更符合人脑思维特性,更合理有效;为提高查询效率,在进行查询时首先对原始数据序列提取能反映数据变化趋势的特征极值点,然后仅对特征极值点进行相似查询,极大减少了数据存储量,提高了查询计算速度。该算法经实验验证切实有效可行,相对其它算法能明显提高查询速度和准确率。 相似文献