首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容。文中提出一种融合多类特征识别Web查询意图的方法。将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征。在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88。5%的测试查询获得准确的意图识别结果。  相似文献   

2.
为了提高搜索引擎查询结果的质量,越来越关注于对用户提交的网络查询意图的识别。基于查询session对用户提交的查询进行多维度特征提取,尽量能全面系统地描述查询分类特征,并使用SVM进行分类。实验结果表明通过结合查询的多个特征有助于识别查询意图,在人工标注的测试集中对查询意图分类的正确率达到80%。  相似文献   

3.
用户查询意图是指用户在构建查询时,希望搜索引擎能够返回的信息.如果搜索引擎可以判断用户当前查询与之前输入的查询是否属于同一查询意图,那么可以为用户提供更适当的查询建议、查询扩展或者个性化检索服务等.该文提出了基于点击相似度切分用户查询意图,在决策树模型和CRF模型上都取得了一定的提升.利用用户点击信息可以提高查询意图切分的效果,引入用户点击信息后,基于决策树的方法,F值提高1%,基于CRF模型的F值提高1.4%.  相似文献   

4.
用户查询意图模型是查询扩展和查询推荐研究中的一个热点。然而,日志包含的大量噪声对主流的用户查询意图模型构建过程具有较大负面影响。观察日志发现,用户试探性点击是日志噪声的一个主要来源。由此,基于试探性点击的特征提出了一种融合用户学习过程的用户查询意图模型。该模型对用户从试探性点击中学习到的经验进行建模,并基于用户学习到的经验对试探性点击进行识别和过滤。一系列实验结果表明,该模型在日志噪声较高的情况下能够有效过滤试探性点击产生的噪声,提高用户查询意图描述的准确率。将该模型应用于查询推荐后,能有效提高查询条件间的相似性计算结果,并提高查询推荐结果的准确率。  相似文献   

5.
现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,并利用该模型学习所得的查询特征进行查询聚类。基于查询图信息的GPLSI模型利用查询的词语、点击和session共现现象,从查询的文本特征、点击行为和session信息等多个方面来模拟查询意图的产生和表现,学习查询在不同搜索意图上的概率分布。最后,实验结果验证了基于查询图信息的PLSI模型用于查询相似度计算和多意图查询聚类中的有效性。  相似文献   

6.
"N1+N2"作为现代汉语中常见的短语形式,亦广泛存在于搜索引擎检索用语中。以日志短语词典为基础,根据搜索日志查询串的语言特点,对包含"N1+N2"型短语的查询串进行改写,其中包括空格分割、引号加注和焦点强调方法,并对查询串粗略分类。实验结果显示:在引号加注的作用下MPA由0.362提高到0.441;导航类查询MRR值从0.64提升到0.719,信息事务类查询MRR值从0.25增加到0.344。从而验证了短语特征能够指导查询结果优化,进而提升搜索引擎性能。  相似文献   

7.
采用查询建议技术表现用户查询意图的多样化,并自动向用户提供多种选择,是当前搜索引擎普遍的做法。但当前的查询建议研究鲜有考虑时间因素对生成查询建议的影响,而实际上在很多情况下,用户的查询意图会随着时间的推移发生改变。为此,根据时间点击图挖掘原理提出一种查询建议方法。对原始的查询日志文件进行预处理,生成时间点击图。对时间点击图进行非连通子图检测和图的合并操作,以降低或消除图的非连通性。采用基于随机游走模型的图挖掘算法,生成给定查询的查询建议集。在真实的Web环境下进行实验,结果表明,利用该方法能够提高查询建议的精度和差异度,从而生成更加可靠的查询建议。  相似文献   

8.
查询歧义作为查询分类的子问题在信息检索领域已经得到了很多的关注,现有的研究主要是对查询内容上的歧义进行分类,而忽略了用户查询需求形式上的歧义。该文针对查询需求歧义问题进行了研究,提出了相应的查询需求分类模型。该文利用网页目录构建用户需求形式分类体系及站点列表,在大规模商业搜索引擎日志上进行用户点击覆盖检测,从而得到对查询需求形式的描述。该文的贡献在于提供了一种实际可行的查询需求分类方法,搜索引擎可以根据用户需求的区别调整排序方式,从而改善搜索性能。  相似文献   

9.
基于用户查询意图识别的Web搜索优化模型   总被引:2,自引:1,他引:1  
杨艺  周元 《计算机科学》2012,39(1):264-267
在对用户查询意图进行分析分类的基础上,提出了一种Web搜索优化模型。该模型通过识别用户查询意图来查询意图特征词和内容主题词的双重约束,再结合用户查询行为获得查询目标,既保证了用户查询意图的准确匹配,又自动过滤和屏蔽了不相关信息。与相关工作对比,其重点在于准确获取用户查询意图,提高用户满意度。实验结果表明,该模型在实现信息搜索准确性和用户对查询结果满意度方面比传统搜索方法有明显改善。  相似文献   

10.
利用搜索日志中查询串自身信息和用户点击信息,提出了双层模型识别领域查询串的方法。第一层模型采用贝叶斯法则和词典相结合的方法对查询串进行识别;针对搜索日志查询串内容简短、信息量少的特点,提出基于域名可信度的第二层识别模型。在搜狗2012版用户查询日志上对双层模型进行了开放测试,召回率和准确率分别达到了85.2%和94.6%,实验结果表明了该方法的有效性。  相似文献   

11.
数据仓库系统中利用物化视图可以提高查询效率,但是,过分使用物化视图重写查询有时不一定能起到提高查询性能这一预期目的.针对QRA算法的不足并结合左深度处理树技术提出一种改进算法,通过实验结果表明由改进算法优化后查询的性能更优.  相似文献   

12.
对象查询语言一直是OODBMS中的一个重要研究课题。本文阐述了对象查询语言的基本途径与设计途径。通过Strawman模型,对几种著名的对象查询语言进行了分析与比较,同时,探讨了对象查询语言中存在的问题。最后,针对KOBS知识库系统的要求,提出一种知识对象查询语言的设计框架。  相似文献   

13.
面向对象的生产管理查询系统   总被引:3,自引:0,他引:3  
本文在进行了电力系统生产部门的需求分析和当前MIS的功能分析之后,提出如何在现有MIS的基础上,建立一个面向对象的一次接线图查询系统,提高MIS的使用效率。  相似文献   

14.
对目前的数据库访问技术作了简单的介绍,再以机械设计人员对键宽和键高的查询为例子,介绍了数据查询的实现方法。其中键宽、键高的查询以Delphi中的ADO组件连接加密的MS—ACCESS数据库实现。借此帮助企业和工厂中的机械设计人员掌握一种简单易行的应用程序开发方法。  相似文献   

15.
柳诚飞  孙钟秀 《计算机学报》1991,14(10):748-756
本文研究了语义查询变换的逻辑基础,讨论了分布式数据库系统中语义变换的可能性和必要性,概括了应用领域中的一些语义信息,提出了一个基于启发式规则的分布式查询变换机制.  相似文献   

16.
为使数据仓库更好地为决策支持服务,本文提出了一种面向主题的智能查询方法,增强了数据仓库查询的智能化程度,使用户能够基于领域专家知识进行动态查询,并且为用户的查询提供更多的相关信息。  相似文献   

17.
半结构化数据查询重写   总被引:10,自引:1,他引:10  
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,信息集成,语义缓存等问题紧密相关,目前Internet上存在海量的半结构化数据,在信息集成过程中产生了大量半结构化视图,如何利用物化半结构化视图来重写用户查询,减少响应时间成为研究热点问题,上述问题本质上是NP问题,提出了一种半结构化查询重写的新方法,该方法在保证算法正确性和完备性的基础上,利用半结构化数据特点和查询子目标之间的关系,减少了指数空间的查询重写候选方案生成,理论分析表明,它极大地降低了算法的代价。  相似文献   

18.
姜云飞 《计算机学报》1995,18(7):517-522
本文提出了L集合的概念以及一种新的使用L集合的一阶数据库询问求值方法。因为这种方法对原数据库只增加一个新字句,所以询问求值的效率大为提高,而且因为可以直接使用L集合回答对数据库的询问,求值过程比较简单。  相似文献   

19.
由于传统的P2P查询处理将用户查询作为独立的关键字对待,只考虑其字面符号意义而不考虑其语义。因此,用户的查询需求往往得不到真实的体现。基于本体的P2P资源匹配使用本体对网络资源进行了描述,在很大程度上反映了资源的语义,然而仍需要对查询请求进行语义扩展才适合在资源的本体中进行查询处理。使用RDF三元组描述用户请求,并扩展其语义表达能力,分析本体中概念间的上下位关系,对查询请求进行语义扩展,扩展后的查询适合于利用本体进行查询匹配。分析表明,这种扩展是有效的合理的。  相似文献   

20.
文本对象查询的相关性计算   总被引:2,自引:0,他引:2  
本文把特征文件,符号对象模型及时间戳排序等概念引入到文本对象查询系统的设计之中,提出了基于索引调组集的用户查询和文本对象相关性计算,以词组标识解决词组同义词等价性判定问题以及借助于时间戳排序技术充分利用查询反馈信息以提高系统时空效率的算法和方法,并讨论了面向文本数据库管理系统的文本对象查询的优化策略及逻辑实现等问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号