首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
一种全新的全文索引模型--后继数组模型   总被引:10,自引:0,他引:10  
提出了一种新的全文索引模型--后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.  相似文献   

2.
倒排索引创建效率和查询效率是全文检索技术的两个重要方面.针对传统倒排索引创建方法效率低下的问题,提出了基于缓存满再写临时文件和双缓冲区相结合的索引创建机制,充分利用内存和CPU资源以加快倒排索引的创建速度;提出了查询缓存机制,以提高倒排索引的查询效率.分析及实验结果表明,提出的索引创建机制能有效地提高索引创建速度,查询缓存机制能有效地加快查询速度,提高了全文检索系统的时间和空间效率.  相似文献   

3.
无线环境的特殊性导致传统的关键字检索方法不能很好地用于周期数据广播之中.倒排表是全文检索中广泛使用的一种索引技术,但倒排表索引和基于哈希的数据索引无法解决索引结构过大的问题.为此,在周期数据广播环境下,提出一种新型的关键字索引结构,对倒排表进行编码压缩,缩减索引结构来减少访问时间和调谐时间.同时,与编码压缩索引相结合,设计一种周期数据广播下的文档调度方法.在真实数据集上进行的实验结果表明,该方法可缩减索引结构的规模,降低访问延迟和能耗.  相似文献   

4.
基于单汉字索引的全文检索系统的优化研究   总被引:7,自引:0,他引:7  
对于按照单汉字建立倒排索引的全文检索系统,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法:一是利用参数化的Golomb编码对倒排文件进行压缩;二是对求集合交集的逻辑乘算法进行改进;三是运用并行计算和双缓冲技术。实验结果表明,经过优化后的单汉字全文检索系统已达到实用化的程度。  相似文献   

5.
基于动态文档集的索引技术*   总被引:1,自引:0,他引:1  
倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。  相似文献   

6.
蒙辉  陈燕 《微机发展》2007,17(4):38-40
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。  相似文献   

7.
本文在对Lucene全文检索、索引开发包深入研究的基础上,设计了多索引器索引方案,有效地减少了索引时间,提高了索引效率;在建立倒排索引时,通过对索引表中词条排序过程进行优化,改进排序方式,提高了化工词汇的查找效率;对于待索引的文档加入不同类型的权值,可以提高检索文档的准确度,适应化工专业搜索引擎的需求.  相似文献   

8.
搜索引擎的混合索引技术   总被引:5,自引:0,他引:5  
倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果。  相似文献   

9.
一种高效的全文检索索引技术*   总被引:7,自引:0,他引:7  
针对目前比较流行的基于词的倒排文档索引模型,结合全文检索数据的特点,提出了变长编码的索引压缩算法。利用该压缩编码,研究了基于内存缓存的快速创建索引的流程。通过实验,对索引膨胀率、创建时间和检索响应速度进行了对比分析,表明该技术提高了索引的空间与时间效率。  相似文献   

10.
探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制。借助中科院的高精度ICTCLAS中文分词系统,采用C++/STL语言仿真实现了一个中文全文检索系统。该文列出部分关键代码,利用搜狗实验室提供的数据进行实验。通过改进压缩算法,系统的磁盘利用率提高了近80%。  相似文献   

11.
关键词检索方式是一种以词汇控制为主流控制方式的主题检索方式,它的致命不足是"字面匹配";概念控制仍属于词汇控制的范畴,只是用概念的相交、概念的匹配等逻辑方法实现的语义匹配取代传统的字面匹配。如何将检索从关键词层面提高到知识(或概念)层面,是目前情报信息检索领域研究的一个热点。文章通过对概念检索、语义检索以及两者之间关系的阐述,说明了如何实现自然语言检索中的概念语义控制,从而能够从概念语义层面上来认识和处理用户的检索需求。  相似文献   

12.
本文介绍了网络信息检索的特点、利用计算机网络从国内外现有的信息检索系统快速查找信息的方法。  相似文献   

13.
本文介绍了网络信息检索的特点、利用计算机网络从国内外现有的信息检索系统快速查找信息的方法。  相似文献   

14.
针对当前基于文本检索方法的图像目标对象匹配技术无法适应海量图像数据库检索的问题,本文提出一种有效可行的海量图像数据库的检索方法,并给出了该系统的构建框架。用户通过在图像中选择一块区域作为检索的目标对象提交给系统,它将从图像数据库中检索出包含有相同或相似目标对象的图像,将其排序后返回给用户。实验表明,本文提出的方法具有检索准确率高、响应时间短等特点,是一种有效的海量图像数据库检索方法。  相似文献   

15.
1.引言面对日益庞大的信息量,如何有效地检索到感兴趣的内容是至关重要的。新闻视频、音频(包括电视、广播)与文字报道相比,更为生动,表达更为丰富,但也有数据量大、难以组织、索引、检索等缺点。这主要体现在两方面; 文本有标题、段等明显的辅助标记,而视频、音频则没有。一般的浏览工具只有播放、快进、快退、拖动定位等简单手段。这对于几十、几百小时,而且还在日益增长的视频、音频数据库,是远远不能满足要求的。  相似文献   

16.
数字图书馆信息检索技术   总被引:2,自引:0,他引:2  
本文讨论了数字图书馆中文本、图像、音频、视频等媒体基于内容的信息检索技术 ,介绍了人工智能在数字图书馆信息检索中的应用 ,提出利用知识发现技术和智能信息推拉技术构造数字图书馆的智能信息检索系统 ,向用户提供主动的、个性化的信息服务。  相似文献   

17.
熊华 《计算机工程》2008,34(12):257-258
基于内容的3D模型检索技术难以提取形状特征,该文通过提取表面面积分布来表示3D模型的形状特征,采用主分量分析方法确保特征满足平移不变性、旋转不变性、对称不变性。以切分块内三角面片面积和与总面积的比值作为特征,确保缩放不变性。二次型形式的距离公式计算的相似度能够有效地区分特征分量的空间位置。实验表明,基于面积分布的检索技术具有较好的检索效果。  相似文献   

18.
An unsolved problem in logic-based information retrieval is how to obtain automatically logical representations for documents and queries. This problem limits the impact of logical models for information retrieval because their full expressive power cannot be harnessed. In this paper we propose a method for producing logical document representations which goes further than other simplistic “bag-of-words” approaches. The suggested procedure adopts popular information retrieval heuristics, such as document length corrections and global term distribution. This work includes a report of several experiments applying partial document representations in the context of a propositional model of information retrieval. The benefits of this expressive framework, powered by the new logical indexing approach, become apparent in the evaluation.  相似文献   

19.
采用合作缓存技术的并行全文检索   总被引:8,自引:0,他引:8  
全文检索是一种资源消耗型操作,并行全文检索可以缩短全文检索的响应时间,以前的并行检索研究主要集中在磁盘资源和CPU资源的优化利用方面,本文提出一种采用合作缓存技术的并行全文检索模型,以优化对内存资源的利用,并对该模型进行了分析和评价,说明该模型可以有效地提高检索性能。  相似文献   

20.
该文简要从信息检索的一般过程出发,分析了基于本体的知识检索的工作原理以及一般模型;着重对现有的知识检索智能性不足的缺陷,引入IGA、多Agent等技术,设计了一个基于本体的智能化知识检索模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号