共查询到20条相似文献,搜索用时 78 毫秒
1.
基于概念检索的中文搜索引擎的设计与实现 总被引:4,自引:0,他引:4
构建语义库和扩展查询是影响概念检索效率的主要因素。提出一种自动构建语义库和相关性查询扩展的方法,方法利用关联规则挖掘技术,自动从文档中导出概念/词语之间相关性及层次关系,构建关联库,再通过关联库,对查询请求进行相关性扩展,以实现概念检索。实验结果显示,方法是有效的,能提高信息检索的查全率和查准率。 相似文献
2.
本文将概念检索扩展到面向领域主题检索的范畴,提出了面向领域主题的智能检索模型。给出了概念语义网络和面向领域主题的形式化描述,利用概念语义网络实现领域主题的同义词及其语义蕴含扩展,并实现一个基于建筑业的面向领域主题的智能搜索引擎。 相似文献
3.
当前的搜索引擎已不能很好的满足用户的需求,基于关键词的概念搜索引擎就是要对用户输入的关键词进行概念分析,建立概念关键词集合,然后再去搜索。搜索中我们要充分考虑关键词在文档中的位置,关键词在文档中的权重应与关键词在文档中的位置成函数关系。同时也要考虑个人的兴趣,根据个人的兴趣对搜索到的文档排序。 相似文献
4.
关键词检索方式是一种以词汇控制为主流控制方式的主题检索方式,它的致命不足是"字面匹配";概念控制仍属于词汇控制的范畴,只是用概念的相交、概念的匹配等逻辑方法实现的语义匹配取代传统的字面匹配。如何将检索从关键词层面提高到知识(或概念)层面,是目前情报信息检索领域研究的一个热点。文章通过对概念检索、语义检索以及两者之间关系的阐述,说明了如何实现自然语言检索中的概念语义控制,从而能够从概念语义层面上来认识和处理用户的检索需求。 相似文献
5.
6.
7.
针对现有图像检索方法中存在的不同用户间因对图像的理解差异而存在的歧义问题,通过引入概念抽象的思想,将图像标注和检索中语义相关的关键词联系起来,统一不同用户对图像语义的理解和描述;结合相关反馈技术,确定检索关键词所代表语义概念信息,并实现概念层次的图像检索.实验结果表明,该方法能有效地提高图像的检索性能. 相似文献
8.
面向XML文档的概念检索技术 总被引:11,自引:1,他引:11
面向XML文档的信息检索是一个重要的研究课题,文中介绍了结构化文档的结构索引以及语义检索中的“上下文共现分析”技术,并在此基础上提出了一个面向XML文档的概念检索原型系统,并对系统设计及实现中应注意考虑的几个主要问题进行了分析。 相似文献
9.
设计了面向XML文档检索的搜索引擎模型,该模型包括机器人模块、转换模块、解析模块、索引模块和查询模块这五个部分。转换模块和解析模块是专门设计的。介绍了模型的设计思想及框架,详细描述了各模块的结构和实现思想。 相似文献
10.
面向主题的概念检索研究 总被引:2,自引:1,他引:2
该文提出了一种基于概念网络和主题概念树的面向主题的文本检索算法。依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。关联度的计算模型考虑了词与词之间,句与句之间的语义激励。通过关联度在主题概念树上的传播模型,实现复合概念关联度的计算。检索结果按关联度大小降序排列。基于主题概念树的概念检索导航为用户检索提供了便利。 相似文献
11.
Enhancing Concept-Based Retrieval Based on Minimal Term Sets 总被引:1,自引:0,他引:1
A.H. Alsaffar J.S. Deogun V.V. Raghavan H. Sever 《Journal of Intelligent Information Systems》2000,14(2-3):155-173
There is considerable interest in bridging the terminological gap that exists between the way users prefer to specify their information needs and the way queries are expressed in terms of keywords or text expressions that occur in documents. One of the approaches proposed for bridging this gap is based on technologies for expert systems. The central idea of such an approach was introduced in the context of a system called Rule Based Information Retrieval by Computer (RUBRIC). In RUBRIC, user query topics (or concepts) are captured in a rule base represented by an AND/OR tree. The evaluation of AND/OR tree is essentially based on minimum and maximum weights of query terms for conjunctions and disjunctions, respectively. The time to generate the retrieval output of AND/OR tree for a given query topic is exponential in number of conjunctions in the DNF expression associated with the query topic. In this paper, we propose a new approach for computing the retrieval output. The proposed approach involves preprocessing of the rule base to generate Minimal Term Sets (MTSs) that speed up the retrieval process. The computational complexity of the on-line query evaluation following the preprocessing is polynomial in m. We show that the computation and use of MTSs allows a user to choose query topics that best suit their needs and to use retrieval functions that yield a more refined and controlled retrieval output than is possible with the AND/OR tree when document terms are binary. We incorporate p-Norm model into the process of evaluating MTSs to handle the case where weights of both documents and query terms are non-binary. 相似文献
12.
在信息时代,面对日益庞大的信息资源,需要通过一种科学手段来获取自己需要的准确及时的信息,这种科学的手段就是检索,信息检索。信息检索就是只从任何文献集合中查出所需信息的活动、过程和方法。通过论述信息检索的工作原理和其在网络环境下的作用,对比分析了基于网络的信息检索几种类型的特点,对高速而有效的信息检索系统的核心技术搜索引擎技术进行了分析,指出随之带来的亟待解决的快速有效获取信息的问题和搜索引擎技术符合时代要求的发展方向。 相似文献
13.
基于多模态概念关联图的视频检索 总被引:1,自引:0,他引:1
为了有效地提高基于概念的视频检索的检索性能,提出一种新颖的基于多模态概念关联图的视频检索方法.首先通过分析查询与概念之间的组织关系得到网状关系模型描述,并基于该模型构建概念关联图;然后提出查询与概念的多模态映射结构,将多模态查询融入概念关联图,增强概念扩展的针对性;之后使用流形排序动态地扩展索引概念集;全局稳态后采用正交的概念融合方法计算视频索引值,用于视频检索.与多种典型的基于概念的视频检索方法相比,文中方法的平均检索精度增幅达14.6%~86.2%.此外,实验结果表明,该方法在实际的交互式视频检索系统中也具有良好的适用性. 相似文献
14.
论述了信息检索含义,对比分析了不同的网络环境下信息检索类型的特点,对www环境下搜索引擎系统进行了分析,总结论述了其集中/分布式搜索引擎的核心问题和4种设计方案。 相似文献
15.
随着计算机的广泛应用以及互联网的飞速发展,互联网流量呈现爆炸式增长的态势。为了应对日益严重的网络滥用以及网络安全事件,出于安全取证的需要,必须对互联网流量进行收集、存储和分析。互联网流量的监控需要及时统计网络流量的源地址、目的地址、源端口、目的端口、协议、时间戳等信息,以便进行流量统计和综合分析。但是网络流量信息是海量的,如何快速检索相关流量是一个挑战性问题。在搜索引擎中,为了处理海量数据检索,倒排索引是快速搜索技术的关键方法。文章把搜索引擎中的倒排索引方法和索引压缩算法应用到互联网网流信息检索中。通过实验测试和验证,在网流信息检索中,倒排索引以及索引压缩算法能够有效提高检索速度。 相似文献
16.
基于全文搜索的中文搜索引擎设计技术 总被引:6,自引:0,他引:6
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。 相似文献
17.
搜索引擎检索系统质量评估 总被引:6,自引:0,他引:6
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用InfoMall系统提供的历史网页服务消除不同搜索引擎搜集系统收集网页集合的差异,得到如下结论:①评测员之间的差异很大,但评估实验结果保持稳定;②使用连续型的相关度评分以及对应的评估指标比二元相关度评分及指标具有更好的区分能力;③使用50左右规模的查询集合和DCG这样的连续型评估指标可以有效进行评估实验. 相似文献
18.
XML文档的查询索引是当前研究的热点.该文探讨XML文档的索引技术,包括索引结构的设计等问题,给出了一个高效的XML索引方法,采用独特的编码方法,对XML文档及其遵循的DTD同时建立索引,有效支持内容和结构的双重检索;该方法结合了区间编码、倒排表和路径索引的思想,利用DTD结构信息来提高查询的效率.实验结果表明,本文提出的方法可以有效地降低建立XML数据索引的代价,能够缩短查询的响应时间. 相似文献
19.
20.
彭波 《计算机工程与科学》2006,28(3):1-4
随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构,并分析了索引创建和索引检索中的相关实现技术。 相似文献