首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 15 毫秒

1.  搜索引擎分块索引技术研究  
   田海龙  缪新颖《电脑编程技巧与维护》,2017年第11期
   搜索引擎通常使用签名文件、倒排索引、后缀树/后缀数组来构建索引,其中倒排文件由于性能可靠、实现简单,得到广泛应用.但是在现今海量数据情况下,有时倒排索引仍显力不从心,导致检索性能不佳,提出了分块索引术,可以有效提高基于倒排索引搜索系统检索效率.    

2.  二元互关联后继树精简索引模型研究  
   霍林  黄俊文  卢正鼎  黄保华  潘英花  王力《小型微型计算机系统》,2011年第32卷第2期
   全文检索领域的关键问题是索引模型以及索引的创建与检索算法.基于二元互关联后继树模型,提出一个实用性能好的后继节点有序的后继树精简索引模型(SIRST),并给出此模型下索引的创建与检索算法.通过将该模型与使用广泛的倒排文件模型(IF)进行比较,表明SIRST的检索效率远远高于IF,同时,随着文本集规模越来越大,SIRST的创建效率优势愈发明显.    

3.  微博中基于增强型倒排索引的特定文档影响力估计算法  
   司宏伟《计算机工程与科学》,2014年第3期
   微博搜索系统中,将微博帖子根据搜索相关性和重要性进行排序,并通过列表的方式返回结果,是目前信息内容的主要展示手段。基于向量空间模型的打分函数被广泛地应用于该类系统中。事实上,微博系统中的帖子重要性打分函数实际取值并不为用户所见,文档的影响力通过排名的方式表现出来。对于一个检索外的文档,如何衡量其在信息检索系统文库中的影响力?一般搜索引擎或信息检索系统并不能很好地回答该问题。在微博短文本的基础上引入了社交影响力这一概念,并通过在文本倒排索引基础上设置反向位置标记,给出了一种全新的影响力度量指标,有效地回答了前述问题。理论分析和数据实验验证了算法的有效性和效率。    

4.  基于动态文档集的索引技术*  
   潘隆禧  孙乐《计算机应用研究》,2009年第26卷第1期
   倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。    

5.  Lucene索引技术的研究  
   李士窑《硅谷》,2009年第24期
   信息技术的飞速发展使得信息资源日剧丰富,而基于传统的数据库精确匹配的查询方式己不能满足海量信息检索的需求。为达到检索的速度快,查的准,查的全的目标,目前最有效方法是建立辅助的数据结构——倒排索引。利用关键词直接确定文档列表,关键词是和文档有着对应的关系,确定关键词就确定文档.速度极快,是与传统的顺序查找和记录组织方式相反的,因此称为倒排引,Lucene就采用倒排索引。因此,将从项目设计规划的角度分析研究Lucene索引的结构,建立,及优化,并提出一种索引维护的方案。    

6.  一种新的基于XML的索引机制  被引次数:4
   姚全珠  丁晓剑  任雪利  张志锋《计算机工程》,2006年第32卷第15期
   当前基于Web的半结构化数据越来越受到重视。该文分析了当前对XML数据检索的相关工作,提出了一种路径索引技术,并将之无缝结合了基于文本的倒排索引文档,以实现XML文档的内容和结构的双重检索。该方法只需要对文档库扫描一次,可以大幅度降低用户查询时间。    

7.  一种应用于闪存数据库的高效B+树索引机制  
   周斯忠  陈耀武《计算机工程》,2013年第9期
   为解决现有闪存数据库索引机制无法同时具备高索引更新性能和高检索性能的问题,提出一种应用于闪存数据库的高效B+树索引机制。该机制采用日志方式更新索引,利用日志缓存区保证日志快速写入闪存。针对日志方式检索效率低的缺陷,设计节点日志映射表,通过哈希映射直接索引节点更新记录,避免全局搜索节点日志。将更新日志整合为B+树逻辑节点,使索引检索转化为B+树深度搜索,在此基础上设计节点缓存区,提高节点检索效率。实验结果表明,该机制相比日志型索引机制BFTL,更新效率提高了51%、检索效率提高了2.3倍,相比基于Nand闪存转换层的B+树索引机制,在保证与其相当的高检索效率的同时,更新效率提高了2.4倍。    

8.  Lucene索引技术的研究  
   李士窑《硅谷》,2010年第24期
   信息技术的飞速发展使得信息资源日剧丰富,而基于传统的数据库精确匹配的查询方式已不能满足海量信息检索的需求。为达到检索的速度快,查的准,查的全的目标,目前最有效方法是建立辅助的数据结构——倒排索引。利用关键词直接确定文档列表,关键词是和文档有着对应的关系,确定关键词就确定文档,速度极快,是与传统的顺序查找和记录组织方式相反的,因此称为倒排引,Lucene就采用倒排索引。因此,将从项目设计规划的角度分析研究Lucene索引的结构,建立,及优化,并提出一种索引维护的方案。    

9.  基于双层索引网络模型的P2P数据库关键字搜索  
   马光志  朱辉  龚小翔《计算机工程与设计》,2007年第28卷第14期
   分布式数据库系统中信息检索对网络状态稳定程度要求高,并不适用于P2P网络.目前的P2P数据库系统也存在通信量高,搜索计算量大等缺点.介绍了一种基于双层索引网络模型的P2P数据库的关键字搜索策略,采用双层索引模型大大减小网络通信量,同时使得在节点成员关系频繁变化的情况下也很有效.采用的关键字搜索根据相似度进行匹配,使用局部结果合并以获得更丰富的结果.    

10.  倒排索引中的文档序号重排技术综述  
   史亮  张鸿  刘欣然  王勇  王斌《中文信息学报》,2015年第2期
   倒排索引作为文本搜索的核心索引技术,广泛应用于搜索引擎、桌面搜索和数字图书馆领域。倒排索引由字典和对应的倒排表组成,倒排表一般采用差值存储和整数编码进行压缩。研究表明,当倒排表具有较好的局部连续性时,上述方法能够获得很高的压缩率。整数编码研究通过不断改进编码算法来充分利用倒排表的局部连续性特征,而文档序号重排正是一种对文档序号重新排列来产生局部连续性的技术。通过文档序号重排,索引压缩率得到显著提高。该文主要介绍近年来文档序号重排技术取得的研究成果:首先介绍索引压缩的基本原理,然后详细介绍文档序号重排技术,包括分析、对比各个方法的优劣;最后对文档序号重排技术进行总结、整理和展望。    

11.  面向XML文档的二级索引技术及其在XML关键词检索中的应用研究  被引次数:1
   向永清  邓志鸿  于航  高宁《计算机研究与发展》,2009年第46卷第Z2期
   随着互联网上XML文档的大量增加,如何高效地索引、存储和检索这些XML数据成为一个非常值得深入研究的课题.目前,在XML关键词检索方面,主流的检索系统都是建立在一级索引的基础上.一级索引存在两个明显的缺点:1)索引的冗余度比较高;2)索引的可扩展性和灵活性较差.通过结合传统倒排索引和基于杜威编码的XML节点索引的优点,提出面向XML文档的二级索引模型,并把该模型应用于求解XML关键词检索中的SLCA,实现了基于二级索引的求解SLCA的栈算法.实验表明,二级索引模型能够节省约30%的空间开销,在时间效率方面,基于二级索引的栈算法在效率上比基于一级索引的栈算法要高1个数量级左右,并且随着关键词数目的增加,这种效率优势会越加明显.    

12.  一种高效的全文检索索引技术*  被引次数:7
   陈玮  陈玉鹏  石晶  陆达《计算机应用研究》,2004年第21卷第7期
   针对目前比较流行的基于词的倒排文档索引模型,结合全文检索数据的特点,提出了变长编码的索引压缩算法。利用该压缩编码,研究了基于内存缓存的快速创建索引的流程。通过实验,对索引膨胀率、创建时间和检索响应速度进行了对比分析,表明该技术提高了索引的空间与时间效率。    

13.  基于互关联后继树的XML索引技术  
   雷向欣  胡运发  杨智应  刘勇  张凯《计算机研究与发展》,2005年第42卷第7期
   提出了一种新的根树节点编码方法——基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对任意两个树节点间前后代关系的判断.同时,结合互关联后继树模型(IRST)的标引性、可压缩性等特点,提出基于IRST的根树索引模型Ist3aRTI-Ⅰ,及对该模型空间优化的索引模型IstBaRTI-Ⅱ.IsBaRTI-Ⅰ,Ⅱ采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一,IsBaRTI-Ⅰ,Ⅱ索引建立时间、空间代价小,可快速查询满足XPath表达式在XML文档树中的节点序列和路径.    

14.  分块组织技术的倒排索引方法研究  
   杨晓波《计算机工程与应用》,2012年第48卷第5期
   为了进一步提高检索系统的整体效率,提出了一种分块组织技术的倒排索引方法。具体研究过程是在数据统计的基础上产生倒排索引的检索性能模型,分析倒排文件分块索引项的组织策略,通过仿真实验对检索性能模型进行验证。研究结果表明:分块组织倒排文件方法可以在较小的检索算法循环次数下,获得较高的算法效率,显著减少检索算法的执行时间,验证了倒排文件分块索引方法的可行性。    

15.  排序可验证的语义模糊可搜索加密方案  
   杨旸  杨书略  蔡圣暐  刘佳  李光滟《四川大学学报(工程科学版)》,2017年第49卷第4期
   为解决现有语义模糊可搜索加密方案无法取得排序可验证的问题,提出一种支持语义模糊搜索并能对搜索结果的排序进行验证的方案。首先引入相关度分数和域加权得分,构造精确度更高的倒排索引结构。通过非线性保序加密,云服务器可以对搜索结果进行高效排序,减少了用户的计算开销和网络资源浪费。接着基于WordNet词典集对查询关键词进行语义拓展。在构造出语义拓展树后,只选取最相关的语义拓展词进行查询。通过引入语义相似度,设计双因子排序算法对搜索结果进行精确排序。然后为创建验证信息,将关键词集合插入布隆过滤器中,并计算布隆过滤器、安全索引、密文文档的消息认证码。在搜索阶段,通过布隆过滤器可以验证索引中是否存在查询关键词,并使用消息认证码对索引、文档的完整性和正确性进行验证。通过引入索引树结构进一步提高方案的搜索效率。最后,将本方案与相关方案在功能、存储开销、搜索开销等方面进行比较,并对创建索引、创建验证信息、语义拓展、加密查询、查询、验证等方面的开销进行仿真实验。方案对比分析显示本方案在语义搜索、排序、验证等功能上具有优势。实验结果表明,本方案不仅实现了语义模糊搜索与结果排序,而且实现了排序结果可验证功能。    

16.  自动答疑系统知识库文本的索引研究  
   宁可为《数字社区&智能家居》,2009年第35期
   该文从传统的基于FAQ库自动答疑系统的知识库存储及检索方式的不足出发,提出了知识库文档预处理及建立倒排索引结构的方法。对倒排索引文档进行重组及性能进行优化,初始化了文档的权重,提高了文档内容的检索速度。    

17.  基于策略爬行与混合索引的医药行业垂直搜索引擎的设计与实现  
   王凯  余堃  马增红《数字社区&智能家居》,2008年第4期
   随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。    

18.  基于策略爬行与混合索引的医药行业垂直搜索引擎的设计与实现  
   WANG Kai  SHE Kun  MA Zeng-hong《数字社区&智能家居》,2008年第10期
   随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。    

19.  一种基于动态平衡树的在线索引快速构建方法  被引次数:2
   郭瑞杰  程学旗  许洪波  王斌  丁国栋《计算机研究与发展》,2008年第45卷第10期
   倒排索引的构建可以通过离线方式高效地完成,但是仅当整个数据集索引完毕后方可提供检索服务.在线索引可以在构建倒排索引的同时提供检索服务,新加入的文档即刻可供检索.提出了一种基于动态平衡树的在线索引更新策略,利用动态平衡树控制索引合并过程,使索引合并总是在大小相近的子索引之间进行,以减少索引合并代价,同时可以调节索引和检索之间的性能平衡.该方法提供了一个基于合并的在线索引更新框架,与已有方法相比具有更好的通用性、更高的性能和更好的规模可扩展性.在由4000万张网页构成的270 GB Web数据集上运行的实验表明,该方法在实际系统中是高效的,将索引更新的性能提高了92.28%,而检索性能仅下降4.79%,大幅度降低了在线索引构建的代价.    

20.  基于XML的数字地下空间索引QR树研究  
   谭文垦  王长虹  石忆邵《浙江大学学报(工学版)》,2009年第43卷第9期
   为了提高数字地下空间数据库的存储效率与检索性能,设计基于可扩展标记语言(XML)的数字地下空间索引四叉矩形(QR) 树.该索引将检索过程涉及到的空间限制在整个索引空间的某一部分,XML利用其结构化的特点,改进了传统QR树索引文档与数据结构之间需要序列化的缺点,改善了因数据激增而下降的查找性能;同时利用XML的可扩展性,实现对索引信息规范化、结构化的描述,实现索引文档存储和数据结构组织的显式描述,解决了QR树存储开销较高、结点上溢和下溢问题,实现QR树动态维护,提高索引的稳定性.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号