首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于日志的搜索引擎查询推荐方法大多从流行性角度进行查询推荐,这种方式能够带来不错的推荐效果.然而,流行性行为代表群体用户共性的需求,所以这类推荐方法忽略了用户背景不同带来的搜索需求的差异,当小团体用户的搜索需求与流行性需求不一致时,往往造成小团体搜索需求无法被满足,进而导致针对此类用户的推荐失败.而且,在搜索引擎领域,用户信息难以获取,提供个性化推荐服务也比较困难.为了减少推荐失败的风险,提高查询推荐质量,提出一种折衷的解决方案,面向多样化搜索背景的查询推荐策略.在查询流图的基础上构造密集行为块,通过密集行为块表示用户特征,从而构建典型用户行为模型,并以典型用户行为区分用户背景.另外,还提出了面向多样化搜索背景的查询推荐方法,当搜索词面临多种用户背景时,推荐系统提供多样化的推荐词集合,最后,在真实数据集的实验结果证明了本策略能够在较小程度降低准确度的同时降低推荐失败的风险.  相似文献   

2.
查询建议可以有效减少用户输入、消除查询歧义,提高信息检索的便捷性和准确率。随着电子商务的发展,查询建议也越来越多地应用于电子商务网站的商品搜索中。然而,传统的基于Web搜索的查询建议方法在电商领域并不能完全适用。针对电商这一特定领域,对不同的查询建议技术进行比较,提出了一种综合考虑用户的搜索以及购物行为的查询建议方法,运用MapReduce技术对用户日志进行挖掘,以此生成检索词词库;并通过在线计算与离线计算结合的方法,为用户提供实时查询建议。实验结果表明,本文提出的基于日志挖掘的电商查询建议方法能有效提高查询建议的准确率,并且具有良好的处理性能。  相似文献   

3.
用户在使用现有的搜索引擎时,常因为无法构造清晰准确的查询词而导致检索效果不佳,传统的查询推荐方法没有充分考虑用户行为的关联性,导致了查询推荐的结果不准确.本文提出了一个新的查询推荐模型,即基于点击模型和网络嵌入的查询推荐模型.该模型首先通过点击链式模型嵌入用户的历史检视行为和点击行为,并通过注意力机制衡量查询和返回文档的相关性;然后利用属性异构网络来获取复杂异质网络结构中的潜在语义信息;最后通过多头注意力捕获多个空间的复杂信息,并利用多任务学习来做评分预测.在搜狗实验室提供的公开查询日志上的实验结果表明,我们的模型在查询建议的鉴别式任务和生成式任务中均优于基线模型.  相似文献   

4.
用户查询意图模型是查询扩展和查询推荐研究中的一个热点。然而,日志包含的大量噪声对主流的用户查询意图模型构建过程具有较大负面影响。观察日志发现,用户试探性点击是日志噪声的一个主要来源。由此,基于试探性点击的特征提出了一种融合用户学习过程的用户查询意图模型。该模型对用户从试探性点击中学习到的经验进行建模,并基于用户学习到的经验对试探性点击进行识别和过滤。一系列实验结果表明,该模型在日志噪声较高的情况下能够有效过滤试探性点击产生的噪声,提高用户查询意图描述的准确率。将该模型应用于查询推荐后,能有效提高查询条件间的相似性计算结果,并提高查询推荐结果的准确率。  相似文献   

5.
查询推荐已经成为改善用户搜索体验和提高搜索引擎服务质量的重要方法。提高查询推荐串的质量和用户满意度显得尤为迫切。已有研究方法在相似度计算上忽略了命名实体的重要性和搜索日志整体的信息量度。通过对查询串进行聚类后的热度评估,并提取查询串中的命名实体。然后融合查询串热度信息和命名实体特征到相似度计算公式中,提出了一种新的查询推荐方法,该方法所得结果的满意度平均值均比最新的三种方法的推荐结果值高,表明了该方法的有效性。该方法在相似度计算上利用了识别出的命名实体,同时考虑了推荐串在全局日志中的热度,提高了推荐词的总体质量,但方法局限于提取特征的精确度,有赖于特征进一步的丰富和优化。  相似文献   

6.
基于查询意图的长尾查询推荐   总被引:1,自引:0,他引:1  
查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推荐会受到查询中噪声单词的影响.该文提出了一种新的关于词项查询图(term-query graph)概率混合模型,该模型能够准确地发掘出用户的查询意图.另外,文中还提出了一种融合查询意图的查询推荐方法,该方法可以将新查询中单词的推荐结果按查询意图自然地融合起来,从而避免了噪声单词对推荐结果的影响.实验结果表明,通过考虑查询意图,可以显著提高长尾查询推荐的相关性.  相似文献   

7.
查询推荐是搜索引擎系统中的一项重要技术,其通过推荐更合适的查询以提高用户的搜索体验。现有方法能够找到直接通过某种属性关联的相似查询,却忽略了具有间接关联的语义相关查询。该文将用户查询及查询间直接联系建模为查询关系图,并在图结构相似度算法SimRank的基础上提出了加权SimRank (简称WSimRank)用于查询推荐。WSimRank综合考虑了查询关系图的全局信息,因而能挖掘出查询间的间接关联和语义关系。然而,WSimRank复杂度太高而难以实用,该文将WSimRank转换为一个状态层次图的遍历和计算过程,进而采用动态规划、剪枝等策略对其进行优化从而可以实际应用。在大规模真实Web搜索日志上的实验表明, WSimRank在各项评价指标上均优于SimRank和传统查询推荐方法,其MAP指标接近0.9。  相似文献   

8.
基于关键词的图书搜索系统由于用户输入查询词的模糊性和简单性往往需要利用查询推荐技术对查询词进行扩展。目前的图书查询推荐方法不能辨别出不同用户在不同时期的图书请求意图和兴趣。提出一种基于用户社会关系的查询推荐方法,首先通过分析用户个人资料信息建立用户社会关系对象集合;其次获取用户社会关系对象对图书的标记词,计算输入查询词与标记词之间的共现率并建立用户社会关系标记词推荐集合,选取与查询词共现率最高的标注词进行查询词扩展。在实际图书数据集上的实验表明,该方法大大提高了查询结果的NDCG@10值,提高用户的满意度,表明该方法具有可行性。  相似文献   

9.
基于用户日志的查询扩展统计模型   总被引:24,自引:0,他引:24       下载免费PDF全文
崔航  文继荣  李敏强 《软件学报》2003,14(9):1593-1599
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.  相似文献   

10.
查询会话检测的目的是确定用户为了满足某个特定需求而连续提交的相关查询。查询会话检测对于查询日志分析以及用户行为分析来说是非常有用的。传统的查询会话检测方法大都基于查询词的比较,无法解决词语不匹配问题(vocabulary-mismatch problem)——有些主题相关的查询之间并没有相同的词语。为了解决词语不匹配问题,我们在该文提出了一种基于翻译模型的查询会话检测方法,该方法将词与词之间的关系刻画为词与词之间的翻译概率,这样即使词与词之间没有相同的词语,我们也可以捕捉到它们之间的语义关系。同时,我们也提出了两种从查询日志中估计词翻译概率的方法,第一种方法基于查询的时间间隔,第二种方法基于查询的点击URLs。实验结果证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号