首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
R树索引结构在空间对象查询和复杂空间关系查询方面具有重要作用。传统空间索引结构R树是动态生成的,树的结构是根据连续插入算法实现的,通过分裂子节点直至生成R树的根节点。动态生成算法会导致R树节点最小外包矩形之间的大量重叠,影响空间查询效率,且空间利用率不高。为了弥补动态生成R树的不足,提出了基于CURE算法的静态R树生成方法,给出CU_RHbuilt建树算法,该算法不仅能有效地处理海量数据,识别任何形状的簇,减少矩形重叠度,而且采用划分技术可较大程度地减小计算代价,空间利用率较高。进一步提出了基于CURE算法的R树节点分裂方法。理论研究与实验表明,所提方法具有较高的查询效率。  相似文献   

2.
Z树:一个高维度的数据索引结构   总被引:3,自引:0,他引:3       下载免费PDF全文
张强  赵政 《计算机工程》2007,33(15):49-51
Z树能够高效地处理对高维度数据集的矩形区域查询和最邻近搜索。它按照节点的形状变化量优化数据的插入位置,使节点形状趋于合理。文章给出了一个新的无重叠分裂算法,减少超级节点的产生。引入了动态剪枝和重新插入策略,压缩超级节点的数量和体积。提出了矩形节点的球形化方法和最优子树搜索算法。实验表明Z树的矩形区域查询和最邻近搜索的效率远远高于X树和SR树。  相似文献   

3.
基于栅格的R树更新缓存与批处理机制   总被引:1,自引:0,他引:1       下载免费PDF全文
潘鹏  卢炎生 《计算机工程》2008,34(15):28-30
根据对象分布相对稳定的特点,选择与固定栅格对应的、代表对象分布情况的部分叶子节点作为容纳新记录的种子节点,新记录可直接与种子节点合并而无须遍历R树。随机选择部分无法合并的记录作为种子记录,对活动记录进行简单有效的分组,以插入种子记录的代价实现批量插入。上述2种方法考虑了R树的空间聚簇特性,可在一次更新中完成多项插入与删除,减少了对节点的写操作及对R树的遍历次数。实验证明,该机制在降低索引维护I/O开销的同时保证了查询效率。  相似文献   

4.
QR-树处理海量空间数据时,其深度和R-树内目录矩形的重叠面积会变大,导致查询效率降低。针对该问题采用K-means算法对索引对象进行聚类分析,构造新的聚类中心使其能处理具有多种形体的索引对象,并在QR-树中引入超结点存储聚类结果。提出一种QCR-树空间索引结构来提高查询效率,给出QCR-树的插入、删除和查询算法。实验结果表明QCR-树的查询性能优于QR-树,适用于海量数据。  相似文献   

5.
研究R树特点,考虑了离群点对R树结点构造的影响,结合改进的k-medoids聚类算法提出了一种新的R树构造算法。与传统R树相比,新算法下构造的R树结点更加紧凑。通过实验证明,该优化算法构造的R树在查询性能方面的改进是明显的。  相似文献   

6.
在分析了R树结点分裂方案存在不足的基础上,将分割聚类技术应用到R树结点分裂中,提出基于分割聚类技术的R树结点线性分裂算法(C-Linear),并对C-Linear分裂算法进行了理论分析和实验验证,结果表明该算法具有良好的性能,能有效地提高R树的操作效率.  相似文献   

7.
黄娟  李辉  张觅 《计算机工程》2010,36(21):248-250
现有ATC-GIS采用one-by-one的插入方式将海量新数据插入R树索引中,效率较低,并且不能较好地维护R树查询性能。针对该问题,研究并设计一种基于SCB方法的改进数据插入方法,采用种子树指导聚类并构建输入R树来批量插入新数据,利用再压缩过程优化R树结构,通过实验比较选择STR压缩算法构建输入R树。在ATC-GIS上的实验证明,改进后的方法在插入时间和查询效率的维护方面优于现有系统。  相似文献   

8.
基于Realms的主存R树索引的实现   总被引:1,自引:0,他引:1  
李萍 《计算机应用》2003,23(5):94-97
为了充分发挥主存数据库技术的优越性,提高系统性能,需要使用空间索引,并将索引也放在主存中。R树类是目前空间数据索引的研究热点,具有动态性及构造和维护的简单性,在基本R树索引的基础上便于作各种算法改进,文中开发的基于Realms的空间分析数据库管理系统SADBS中实现了主存R树索引的创建及插入、删除、更新、查询等操作。  相似文献   

9.
半结构化数据相似搜索的索引技术研究   总被引:6,自引:0,他引:6  
杨建武  陈晓鸥 《计算机学报》2002,25(11):1219-1226
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树--CSS-树以及基于CSS-树的相似搜索与动态更新的算法。CSS-树借鉴SS^ -树基于聚类进行节点组织与分裂的基本思想,避免了根据坐标准进行分裂时所要求的维不相关性,同时在节点组织、分裂算法和搜索算法等方面进行了改进,提出了新的搜索剪枝策略,实验表明,该结构及算法对海量半结构化数据相似搜索和效率明显优于传统算法。  相似文献   

10.
土木工程监理视频是提高土木工程监理质量的一种有效手段。首先以土木工程监理视频检索为研究对象,建立土木工程监理视频的语义,且对土木工程监理视频数据进行了语义划分,随后结合维基百科相关的部分中文词条和从土木工程监理领域整理的词条进行词向量训练,并使用这些词向量数据对标注数据条目进行训练,为监理视频R树提供含有语义的词向量数据;然后研究基于谱聚类的节点分裂,提出了基于谱聚类的R树节点分裂算法和基于词向量的R树节点检索算法。最后用实际工程的例子说明了所确定的监理视频语义能准确表示监理视频的主要内容,同时实验结果表明本文的算法优化能有效提高土木工程监理视频的索引速度和检索查全率。  相似文献   

11.
A storing of spatial data and processing of spatial queries are important tasks for modern data-bases. The execution efficiency of spatial query depends on underlying index structure. R-tree is a well-known spatial index structure. Currently there exist various versions of R-tree, and one of the most common variations between them is node splitting algorithm. The problem of node splitting in one-dimensional R-tree may seem to be too trivial to be considered separately. One-dimensional intervals can be split on the base of their sorting. Some of the node splitting algorithms for R-tree with two or more dimensions comprise one-dimensional split as their part. However, under detailed consideration, existing algorithms for one-dimensional split do not perform ideally in some complicated cases. This paper introduces a novel one-dimensional node splitting algorithm based on two sortings that can handle such complicated cases better. Also this paper introduces node splitting algorithm for R-tree with two or more dimensions that is based on the one-dimensional algorithm mentioned above. The tests show significantly better behavior of the proposed algorithms in the case of highly overlapping data.  相似文献   

12.
The effect of buffering on the performance of R-trees   总被引:3,自引:0,他引:3  
Past R-tree studies have focused on the number of nodes visited as a metric of query performance. Since database systems usually include a buffering mechanism, we propose that the number of disk accesses is a more realistic measure of performance. We develop a buffer model to analyze the number of disk accesses required for spatial queries using R-trees. The model can be used to evaluate the quality of R-tree update operations, such as various node splitting and tree restructuring policies, as measured by query performance on the resulting tree. We use our model to study the performance of three well-known R-tree loading algorithms. We show that ignoring buffer behavior and using number of nodes accessed as a performance metric can lead to incorrect conclusions, not only quantitatively, but also qualitatively. In addition, we consider the problem of how many levels of the R-tree should be pinned in the buffer  相似文献   

13.
针对R-树索引空间查询效率低下的问题,提出一种基于结点分裂优化的R-树索引结构:SR-树索引。SR-树索引在结点分裂过程中,通过增加叶子结点的空间数据聚集性来减少叶子结点最小外接矩形的覆盖面积。为了有效降低磁盘读写消耗,SR-树结点在写入索引时,首先将索引树在内存中建好,然后在文件中写入树信息,最后通过递归的方式写入结点。实验结果表明,与R-树索引相比,SR-树索引可以在减少最小外接矩形重叠面积的同时,有效降低查询响应时间,从而达到提高查询效率的目的。  相似文献   

14.
基于聚类的Hilbert R-树空间索引算法   总被引:2,自引:2,他引:0  
R-树适合于动态索引,但空间重叠大,而Hilbert R-树也不能有效降低节点覆盖和交叠,直接影响R-树的查询效率。为适应大量的GIS查询应用需要,提出对Hilbert R-树节点进行聚类的索引算法,较好地解决相邻数据的聚类存放,使叶节点MBR面积减小,内部节点交叠降低,并对该算法进行实验测试和性能分析,结果表明该算法具有较高的查询效率。  相似文献   

15.
邹志文  秦程 《计算机应用》2021,41(3):733-737
现有的R-树空间聚类技术在通常通过随机指定或者计算空间数据间的欧氏距离来选取聚类中心,而未考虑空间数据间的主题相关度。这些导致聚类结果受初始k值影响,空间数据间的关联仅仅是基于地理位置的。针对此种情况,提出了一种基于k-means++的动态构建空间主题R树(TR-tree)方法。首先,在传统的k-means++算法上,通过聚类测度函数动态地确定k个聚类簇,并在聚类测度函数中引入潜在狄利克雷分布(LDA)模型来计算每个空间数据文本的主题概率,从而加强空间数据间的主题关联度;其次,通过主题概率选取概率最大的聚类中心;最后,构建TR-tree,并且在构建时动态分配空间数据。实验结果表明:虽然构建R-树的时间略有增加,但该方法在索引效率及节点间关联度上较仅仅基于地理位置聚类构建R-树的算法有明显提升。  相似文献   

16.
论文结合网格索引和R树索引的特点,提出了一种基于粗分网格和聚类R树的混合索引方案(HSIBGR)。该方案首先将矩形地理空间进行粗网格划分建立一级索引,然后针对每个小网格建立基于R树的二级索引,采用聚类技术处理溢出R树结点的分裂。论文还对HSIBGR索引机制进行了理论分析和实验验证,结果表明HSIBGR索引机制能有效地减少存储开销,提高检索效率,具有良好的性能。  相似文献   

17.
基于leader-follower算法的超级节点P2P网中,研究如何处理新进节点与各超级节点语义不匹配问题,有利于提高节点匹配效率和超级节点性能。引入通用类节点和分裂算法,将与各超级节点语义不匹配的新节点交由通用类节点管理,当管理的节点数目达到一定规模后,采用分裂算法将其分裂为若干语义相似簇,最后用合并排序算法从中选择最优节点作为超级节点。实验表明所提方法提高了节点匹配效率和超级节点性能,具有良好的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号