首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
王海文  于晓强  曹树新 《微计算机信息》2007,23(33):257-258,206
在局部索引架构下,应用搜索引擎优化算法会对索引系统的性能带来负面的影响。目前主要有两种索引架构:全局索引和局部索引,本文针对它们各自的优缺点,应用搜索引擎优化策略,提出综合使用两种索引架构:索引系统整体上采用局部索引架构,并对高频关键词对的postinglist交集采用全局索引架构的方式,可以很好的解决这个问题。  相似文献   

2.
在应用系统中,尤其在联机事务处理系统中,对数据查询及处理速度已成为衡量应用系统成败的标准。而采用索引来加快数据处理速度也成为广大数据库用户所接受的优化方法。在良好的数据库设计基础上,能有效地使用索引是SQL Server 取得高性能的基础,SQL Server 采用基于代价的优化模型,它对每一个提交的有关表的查询,决定是否使用索引或用哪一个索引。因为查询执行的大部分开销是磁盘I/O, 使用索引提高性能的一个主要目标是避免全表扫描,因为全表扫描需要从磁盘上读表的每一个数据页,如果有索引指向数据值则查询只需读几次磁盘就可以…  相似文献   

3.
通过理论分析对全局和分布式索引架构进行了比较,分析了分布式全局索引架构所能够应对的数据规模的上界和分布式局部索引架构在特定数据规模下相应最优的机群规模等。可以证明,在海量数据背景条件下,由于需要求交集的查询结果数据量过大,会导致全局索引架构在查询结果求交集阶段处理时间过长,以致信息检索系统不能满足用户对系统响应时间的需求,因此局部索引架构会成为在面对海量数据时信息检索系统的必然选择。  相似文献   

4.
Hadoop是开源的一个分布式系统基础架构,借助Hadoop,可以在不了解分布式底层细节的情况下,开发分布式程序。文本索引在生产生活中有着广泛的应用,从搜索引擎的倒排索引到操作系统的指令都需要使用文本索引。在hadoop环境中构建文本索引,能够为搜索引擎和文档全文索引提供支持,并且同时兼顾了分布式系统的优点。在Hadoop环境中构建本索引的主要价值有:在分布式平台Hadoop建立倒排索引可以提高建立索引的速度,能够方便的存储大数据量,有着良好的扩展性以便实现在大规模系统中等优点。  相似文献   

5.
邢晨  安义 《数字社区&智能家居》2013,(13):2967-2968,2972
在系统的应用过程中,数据库性能问题一直是决策者和技术人员共同关注的焦点,影响数据库性能的因素有很多,选择合适的索引能有效地提升查询性能。在select和where子句的列上创建连接索引,这样查询就只会访问索引,从而优化查询的性能,提升系统响应速度,节约系统资源。  相似文献   

6.
韩升  刘广志 《微机发展》2006,16(3):208-210
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。  相似文献   

7.
本文以在MS SQLServer中查询优化为目的,从如何确定聚集索引和非聚集索引、索引的编排顺序、设置适当的填充因子和避免不当的索引设置等几个方面,讲述索引设置的一般指导原则,帮助最终提高系统性能。  相似文献   

8.
全文检索系统的数据预处理研究   总被引:1,自引:0,他引:1  
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。  相似文献   

9.
本文以在MS SQLServer中查询优化为目的,从如何确定聚集索引和非聚集索引、索引的编排顺序、设置适当的填充因子和避免不当的索引设置等几个方面,讲述索引设置的一般指导原则,帮助最终提高系统性能。  相似文献   

10.
在大型搜索引擎的查询处理过程中,对索引文件的顺序遍历将导致响应时间过长。自索引结构能够有效解决上述问题。为了进一步缩短查询时间,通过对当前索引文件自索引结构的分析,设计了倒排链表的多层自索引结构。此结构以定长元组为单位,使用迭代的方法提取数据段同步点形成上层自索引。在此基础上,实现了索引压缩与查询系统。基于TREC GOV2数据集的测试结果表明,该系统的各项性能指标均优于不采用自索引结构的查询系统,在不影响结果精度的情况下使检索效率得到大幅提升。  相似文献   

11.
索引在飞行仿真系统数据库中的应用与优化   总被引:2,自引:0,他引:2  
仿真数据库在计算机飞行仿真系统中具有相当重要的地位,整个仿真的过程都是围绕仿真数据库中的数据进行的。仿真结果数据是仿真数据库中最重要的数据,并且是海量的数据,要求有高效的方法对这些数据进行访问、处理。针对此问题,对仿真数据库中的索引技术进行了重点研究。索引技术是数据库应用中提高数据检索最有效的方法,如何有效利用索引技术来优化数据库是提高飞行仿真系统性能的一个重点。结合飞行仿真数据库系统的开发和应用实践,对索引的建立和优化进行了深入研究,提出了仿真数据库中索引的应用策略,并应用到飞行仿真系统的仿真数据库中。仿真结果表明,提出的索引策略有效地提高了仿真数据库的性能。  相似文献   

12.
近年来,随着数据规模的增长,分布式存储已广泛应用。对于分布式存储系统中,应用非主键访问数据存在的性能问题,分析了存储系统中可以实现索引的关键技术。在以分布式索引为基础,探究索引组织形式,提出关于索引的设计,分析分布式索引维护与数据相一致的问题。基于此,利用分布式数据库系统,设计分布式索引组织形式,从而完成索引的性能测试。  相似文献   

13.
数据库的查询优化研究   总被引:1,自引:0,他引:1  
在以数据库为核心的应用系统中,查询操作最为频繁,实现快速查询将直接影响数据库应用系统的性能。正确地理解和恰当地使用索引可以在数据库中实现快速的数据查询。  相似文献   

14.
索引技术是搜索引擎的核心技术之一,索引技术的好坏直接影响到搜索引擎的查准率以及对用户的响应速度.Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构并支持增量索引.但在实际应用Lucene时存在一个值得关注的问题:随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;在搜索引擎应用中,当索引文件量达到一定等级时,搜索引擎就遇到性能瓶颈.在深入分析和研究Lucene索引机制的基础上,采用以内存为缓冲区建索引文件的分布式并行索引技术形成了一个可扩展的搜索引擎解决方案,极大地缓解了建索引给搜索带来的瓶颈问题.  相似文献   

15.
Oracle是目前流行的商业数据库软件,广泛应用于ERP、CRM和电子商务等大中型应用系统。笔者通过分析Oracle数据库索引的相关知识原理,针对几种在Oracle生产系统中常见的疑难场景,归纳整理了几种有效的Oracle索引优化方法,包括重新设计索引、避免系统排序和使用函数索引等,并对这些方法进行了逐一定性分析和举例验证。此外,总结了Oracle的SQL语句优化方法,以期为相关人士提供帮助。  相似文献   

16.
检索性能的优劣在数据仓库应用中是至关重要的,位图索引在性能优化中起关键作用之一,并且它和传统的B树索引是不同的。通过实例描述了位图索引的构成原理,即:位图索引是由一系列有序的位向量组成;详细阐述了位图索引的特性(包括优点和缺点)以及其使用条件。最后文章结论指出合理地使用位图索引可以极大地改善大型系统的检索效率和减少系统资源。  相似文献   

17.
Oracle数据库应用系统的性能优化是一项系统化的工程,涉及到数据库结构的各个方面。本文从B*树索引入手,分析了B*树索引的结构及原理,阐明了如何正确合理地使用B*树索引及其如何优化数据库系统的性能。  相似文献   

18.
构建了一种基于混合索引的浏览器缓存协作系统,它充分利用客户端浏览器缓存的内容,以P2P方式交换Web Cache,克服了集中式代理服务器存在的一些问题。客户端的Internet访问响应时间是系统设计的主要依据。索引技术是系统中影响响应时间的关键技术,为了提高响应时间,对索引技术进行了讨论,并针对该应用的特点进行了改进。系统具有以下优点:易于扩展,网络资源开销小,响应时间短,索引更新及时。  相似文献   

19.
索引技术是搜索引擎的核心技术之一,索引技术的好坏直接影响到搜索引擎的查准率以及对用户的响应速度。Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构并支持增量索引。但在实际应用Lucene时存在一个值得关注的问题:随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;在搜索引擎应用中,当索引文件量达到一定等级时,搜索引擎就遇到性能瓶颈。在深入分析和研究Lucene索引机制的基础上,采用以内存为缓冲区建索引文件的分布式并行索引技术形成了一个可扩展的搜索引擎解决方案,极大地缓解了建索引给搜索带来的瓶颈问题。  相似文献   

20.
吴文娟  车明 《微处理机》2006,27(6):83-85
倒排文件是搜索引擎检索系统普遍采用的索引技术。在实验基础上,针对中文搜索引擎中索引的时效性和传统倒排索引在更新时的缺点,提出分组索引技术和一种追加索引的更新算法,可以有效提高搜索引擎的检索效率,同时不影响系统检索效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号