首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
《计算机工程》2018,(3):189-194
传统的搜索引擎仅返回给用户包含查询关键字的文档,忽略了查询背后用户真正的信息需求。为此,将文档检索看作个性化推荐问题,提出一种查询意图识别的主题模型个性化检索算法。对用户检索历史进行潜在狄利克雷分布主题建模,结合检索历史主题模型识别用户查询的潜在意图,并按主题相关度进行文档推荐,计算查询到文档集的KL距离对文档集排序,最终返回给用户个性化检索文档列表。实验结果表明,与基于协同相似计算和基于用户聚类的推荐算法相比,该算法能够更准确有效地为用户提供个性化检索。  相似文献   

2.
闫蓉  高光来 《计算机应用》2016,36(8):2099-2102
针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、并且各文档之间相似性最小化作为排序原则,将伪相关文档集中各文档进行重排序;最后,将排序后排名靠前的文档作为扩展源进行二次反馈。实验结果表明,与两种传统伪反馈方法相比,该排序模型能获得与用户查询意图相关的反馈文档,可有效地提高检索效果。  相似文献   

3.
综合文档语义与用户查询语义的XML关键字检索   总被引:1,自引:0,他引:1  
黎军  熊海灵 《计算机应用》2010,30(11):2945-2948
为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先改进为语义相关实体子树集来表达查询结果。实验结果表明,该方法能够有效提高关键字检索结果的查准率。  相似文献   

4.
针对信息检索中查询与文档集之间可能存在的“词不匹配”问题,基于兴趣模型提出一种将概念化的兴趣知识与向量空间模型相结合的查询扩展方法。该方法能根据阈值来判断查询扩展是否可行。用户的兴趣偏好是通过Agent代理实时获取的,兴趣知识采用HNC(Hierarchical Network of Concepts, 概念层次网络)理论的概念符号体系表达,这样便于计算概念之间的相似度。实验结果表明,经过查询扩展后的结果相对于未加入查询扩展的结果在性能上提高了29.1%。  相似文献   

5.
基于概念检索的中文搜索引擎的设计与实现   总被引:4,自引:0,他引:4  
构建语义库和扩展查询是影响概念检索效率的主要因素。提出一种自动构建语义库和相关性查询扩展的方法,方法利用关联规则挖掘技术,自动从文档中导出概念/词语之间相关性及层次关系,构建关联库,再通过关联库,对查询请求进行相关性扩展,以实现概念检索。实验结果显示,方法是有效的,能提高信息检索的查全率和查准率。  相似文献   

6.
文章提出了一种基于本体论的Web信息检索模型,它利用领域本体知识库对用户的查询要求进行语义扩展,并且将检索到的文档在语义层模型中根据概念层的概念匹配提出了一种概念关联匹配算法.从而克服了目前的检索工具中仅仅提供基于关键字的检索,但忽视了关键字本身语义信息所造成的错检和漏检.  相似文献   

7.
语义查询扩展中词语-概念相关度的计算   总被引:16,自引:0,他引:16  
田萱  杜小勇  李海华 《软件学报》2008,19(8):2043-2053
在基于语义的查询扩展中,为了找到描述查询需求语义的相关概念,词语.概念相关度的计算是语义查询扩展中的关键一步.针对词语.概念相关度的计算,提出一种K2CM(keyword to concept method)方法.K2CM方法从词语.文档.概念所属程度和词语.概念共现程度两个方面来计算词语.概念相关度问语.文档.概念所属程度来源于标注的文档集中词语对概念的所属关系,即词语出现在若干文档中而文档被标注了若干概念.词语.概念共现程度是在词语概念对的共现性基础上增加了词语概念对的文本距离和文档分布特征的考虑.3种不同类型数据集上的语义检索实验结果表明,与传统方法相比,基于K2CM的语义查询扩展可以提高查询效果.  相似文献   

8.
面向查询意图的搜索引擎设计与实现   总被引:4,自引:2,他引:4  
文军  文贵华  丁月华 《计算机应用研究》2002,19(10):131-133,160
搜索引擎存在很多问题,原因在于引擎不能准确地理解用户的查询意图。提出面向查询意图的搜索系统,该系统允许用户采用自然语言输入查询要求,然后系统展开语义联想,理解出用户的真实意图,并提交用户确认或修改,进而根据确认的真实意图构造查询实例,提交到各个Web搜索引擎搜索,并将返回结果根据用户意排序。同时系统还从用户对查询结果的交互中学习理解用户意图的知识。  相似文献   

9.
基于语义关系查询扩展的文档重构方法   总被引:36,自引:0,他引:36  
张敏  宋睿华  马少平 《计算机学报》2004,27(10):1395-1401
已知文档与用户查询之间相同概念不同表达形式造成的词不匹配问题是影响信息检索效果的重要原因之一.该文提出了根据词之间的语义关系进行扩展和替换的文档重构方法.它与传统的查询扩展不同,实现了同一概念信息的聚集,是更接近于人类进行信息查找的思维方法.进一步地,研究给出一种有效的实时文档重构检索策略,解决了文档重构方法在实际应用中的可行性.在标准测试数据集上的实验表明,基于查询扩展的文档重构方法不仅比不扩展的最佳性能始终有14%~23.4%的提高,而且比相对应的传统查询扩展方法也有约16%的提高.  相似文献   

10.
基于语义理解的智能搜索引擎研究   总被引:1,自引:0,他引:1  
本文提出了一种基于自然语言理解的搜索引擎模型.它的核心技术是基于自然语言理解的相关技术,包括从 关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容 的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询 测试,查准率为86.7%.实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果.  相似文献   

11.
论文提出了基于数学形态学的版面分析方法。该方法是以自底向上为主,同时结合了数学形态学的思想。论文提出的方法,利用数学形态学的膨胀运算和搜索算法,实现对复杂版面进行快速准确的分析。论文以名片版面图像作为测试样本,进行版面分析,取得了预期的效果。  相似文献   

12.
随着XML技术的发展,如何利用现有的数据库技术存储和查询XML文档已成为XML数据管理领域研究的热点问题。本文介绍了一种新的文档编码方法,以及基于这种编码方式提出了一种新的XML文档存储方法。方法按照文档中结点类型将XML文档树型结构分解为结点,分别存储到对应的关系表中,这种方法能够将任意结构的文档存储到一个固定的关系模式中。同时为了便于实现数据的查询,将文档中出现的简单路径模式也存储为一个表。这种新的文档存储方法能够有效地支持文档的查询操作,并能根据结点的编码信息实现原XML文档的正确恢复。最后,对本文提出的存储方法和恢复算法进行了实验验证。  相似文献   

13.
XML Schema作为XML文档模式的定义语言,其语法本身不能保证定义模式的有效性。该文首先分析影响XML文档模式有效性的因素,并构造了XML文档模式图。依据XML实例文档特点,分析了XML文档模式图性质,其中包括递归引用可能导致死锁发生的原因。最后,给出了XML文档模式有效性验证算法,从而弥补了常见验证工具功能的不完整。  相似文献   

14.
局域网文件资源管理器主要实现文件的高效率管理、跨主机管理,实现局域网内的对等通信,管理局域网内主机的上下线信息,浏览任何一台上线主机的文件系统,并实时更新文件信息,以便用户浏览到的是对方最新的文件信息。浏览界面是图形操作界面,类似于Windows的资源管理器界面,方便用户操作,并提供文件的传输请求和文件的删除请求。  相似文献   

15.
Molodtsov (1999) initiated the concept of soft sets in [1]. Maji et al. (2003) defined some operations on soft sets in [22]. Akta? and Ça?man (2007) generalized soft sets by defining the concept of soft groups in [16]. After them, Sun et al. (2008) gave soft modules in [21]. In this paper, the concept of an intuitionistic fuzzy soft module is introduced and some operations on intuitionistic fuzzy soft sets are given. Finally, some of its basic properties are studied.  相似文献   

16.
目前XML工具的编辑能力不足以保证生成有效的XML文档,缺乏对文档模式的合理利用。而由XMLSchema定义的文档模式,不仅提供了有效性验证标准,同时蕴含了生成有效XML文档的准则。本文提出了一种生成有效XML文档的方法。该方法基于XML文档模式图定义不同节点的操作集合,以及该操作集合上的计算和相应操作语义,并分析论证了该方法本身的有效性。  相似文献   

17.
在分析了Biztalk等商业化XML文档映射系统优缺点的基础上,设计和实现了一个多XML文档映射系统TRANSer,提供可视化设计工具让用户通过拖拉等简单操作设计映射关系,同时提供各种各样的函数来配合实现复杂的映射。它允许多个源XML文档映射到目标XML文档,还可以在设计映射关系的同时创建和修改目标XML文档的格式。实践证明,该系统开发效率高,捕述能力强,并且具有良好的扩展性。  相似文献   

18.
TEXPROS (TEXt PROcessing System) is an automatic document processing system which supports text-based information representation and manipulation, conveying meanings from stored information within office document texts. A dual modeling approach is employed to describe office documents and support document search and retrieval. The frame templates for representing document classes are organized to form a document type hierarchy. Based on its document type, the synopsis of a document is extracted to form its corresponding frame instance. According to the user predefined criteria, these frame instances are stored in different folders, which are organized as a folder organization (i.e., repository of frame instances associated with their documents). The concept of linking folders establishes filing paths for automatically filing documents in the folder organization. By integrating document type hierarchy and folder organization, the dual modeling approach provides efficient frame instance access by limiting the searches to those frame instances of a document type within those folders which appear to be the most similar to the corresponding queries.This paper presents an agent-based document filing system using folder organization. A storage architecture is presented to incorporate the document type hierarchy, folder organization and original document storage into a three-level storage system. This folder organization supports effective filing strategy and allows rapid frame instance searches by confining the search to the actual predicate-driven retrieval method. A predicate specification is proposed for specifying criteria on filing paths in terms of user predefined predicates for governing the document filing. A method for evaluating whether a given frame instance satisfies the criteria of a filing path is presented. The basic operations for constructing and reorganizing a folder organization are proposed.  相似文献   

19.
针对XRel模式无法有效支持动态XML文档存储的问题,在区间编码的基础上,引入向量方法提出一种支持XML文档动态更新的编码方案——NewDietz,设计可以存储NewDietz编码元素的关系模式,并给出新元素在关系模式下的更新方法。新模式既保证新元素的有效存储,又兼顾动态XML文档从该模式中重组需要对元素进行祖先-后裔判断的问题。为验证新模式的实际应用效果,开发一个水利空间数据存储与展示模块,并对空间数据分别采用2种存储模式进行验证。对比结果表明,新模式明显提升XML文档在关系数据库中的存储效率,并有效支持XML文档的动态更新,为基于XML的水利业务数据在关系数据库中的高效存储提供一种可能。  相似文献   

20.
基于网络日志挖掘的网页预测系统可以有效地分析用户未来的网络访问请求,从而达到智能推荐、改善网络性能等目的。针对目前的预测模型缺乏有效的语义处理的问题,将词语语义信息和统计语言模型相结合,提出一种基于文档相关度计算的网页统计预测模型。通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为预测的依据。实验表明,该技术使预测模型的性能获得了较大的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号