共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
3.
基于链表结构的概念格渐进式构造 总被引:6,自引:0,他引:6
给出了一种基于链表结构的Godin算法实现方法,该方法采用链表结构组织格结点,并利用索引表,实现了对概念格子结点的快速查找,提高了概念格渐进式构造的效率。最后,以天体光谱数据作为形式背景,实验结果表明,该方法的构造效率要明显优于基于顺序结构的Godin算法。 相似文献
4.
5.
6.
一种基于XML文档关键字检索的结构索引 总被引:2,自引:0,他引:2
XML数据索引对其检索效率有较大的影响。在深入分析现有XMI、结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引--LSS(Level Structure Summary) . LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。 相似文献
7.
无线环境的特殊性导致传统的关键字检索方法不能很好地用于周期数据广播之中.倒排表是全文检索中广泛使用的一种索引技术,但倒排表索引和基于哈希的数据索引无法解决索引结构过大的问题.为此,在周期数据广播环境下,提出一种新型的关键字索引结构,对倒排表进行编码压缩,缩减索引结构来减少访问时间和调谐时间.同时,与编码压缩索引相结合,设计一种周期数据广播下的文档调度方法.在真实数据集上进行的实验结果表明,该方法可缩减索引结构的规模,降低访问延迟和能耗. 相似文献
8.
9.
对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2LZ(n-Gram/2LonZigzagjoin)。在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率。 相似文献
10.
建立文物图像数据库是建立文物数字博物馆的基础,在基于物理特征检索的图像数据库系统中应用了FAC-file这种索引方法,并对系统的检索性能进行测试。对采用索引结构和未采用索引结构的检索时间进行了对比,同时也对FAC-file索引方法的焦点数和索引文件大小进行了分析。测试结果验证了这种索引方法的有效性。 相似文献
11.
Lucene是一个全文索引引擎工具包,具有访问索引效率高、支持多用户访问、跨平台等优点.把Lucene的索引与全文检索数据库的索引进行比较来介绍Lucene的索引原理及其结构组成,并分析通用的检索系统的组成.最后提出了通用的基于Lucene的全文检索系统的设计以及对实现的关键技术进行了探讨. 相似文献
12.
本文在充分实验的基础上,利用Lucene技术实现了桌面批量文件全文搜索引擎,并通过检测词库工具显示Lucene索引数据,阐述了全文搜索的工作原理。 相似文献
13.
基于Web中文检索系统SEARCH2000的设计与实现 总被引:3,自引:0,他引:3
本文详细介绍Search 2000中文检索系统的设计思想及实现方法。与传统的全文检索系统相比,基于WEB的信息检索系统,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有名词和缩略词汇,这些特性成为影响查询精度的主要因素。针对Web的上述特性设计的Search2000全文检索系统,使用智能化的页面相关分析、评分技术,以及高效数据存取、压缩算法和知识库的支持,使其具有使用方便、查询时间短、查询精度高等特点。 相似文献
14.
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。 相似文献
15.
MicrosoftSQLServer2000的全文搜索功能,可以对在非结构化文本数据上生成的索引执行快速、灵活的查询。本文介绍了如何充分利用使用MicrosoftSQLServer2000的全文搜索功能,可以快速实现一个简单、功能强大的web搜索应用程序。 相似文献
16.
MicrosoftSQLServer2000的全文搜索功能,可以对在非结构化文本数据上生成的索引执行快速、灵活的查询。本文介绍了如何充分利用使用MicrosoftSQLServer2000的全文搜索功能,可以快速实现一个简单、功能强大的Web搜索应用程序。 相似文献
17.
18.
19.
基于Lucene的全文检索系统研究与开发 总被引:27,自引:0,他引:27
提出了一种基干Jakarta Lucene的全文检索系统模型。该模型相对于Google的站内检索,以及传统的数据库检索都有较为明显的优势。其关键字的拆分比对技术、信息检索的速度以及最终结果的排序都有独到之处。能够保证检索的前100条记录虽符合检索者的需要。 相似文献
20.
基于Lucene的搜索引擎在远程教育平台中的应用 总被引:1,自引:0,他引:1
一个好的搜索引擎可以使用户高效地搜索到自己需要的信息.Lucene是一个用Java写的全文索引工具包,访问索引速度快,支持多用户访问,可以跨平台使用.分析Lucene的索引原理,实现了一个基于Lucene的远程教育平台的应用. 相似文献