首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
在道路网络中,对象的位置和运动被约束在网络中,对象之间的距离不是传统的欧氏距离,而是由网络连通性决定的网络距离,基于欧氏空间的反k最近邻查询算法不适用于道路网络。为了解决道路网络中移动对象连续的反k最近邻查询问题,给出了道路网络的一种索引结构及一种利用扩展树处理查询的方法,在此基础上,提出了道路网络中适用与单、双色连续反k最近邻查询算法(CRkNNMA算法),证明了该算法的正确性。  相似文献   

2.
欧式空间中的反最近邻查询算法不适用于空间网络环境,故采用任意度量空间中的M-tree索引结构,进行空间网络数据库中的反最近邻查询处理。首先通过预计算的方法得到网络距离信息,依据此距离信息,对空间网络对象建立M-tree索引结构。然后,给出并证明了M-tree中间结点修剪定理,提出一种适用于空间网络环境的反最近邻查询算法。最后实验验证了该算法的有效性。  相似文献   

3.
移动点对象轨迹上k-最近邻查询   总被引:1,自引:0,他引:1  
移动点对象轨迹上k-最近邻查询是时空数据库中重要的查询之一.在时间-距离空间基础上,提出监测第k个最近邻的方法,采取了速度更新预测策略及更新预留内存的自底向上更新的R-树索引结构.当移动对象的速度或路径发生改变时,把即将更新的位置信息先存储在内存更新列表中,后更新列表已达最大预设值时才去更新R-树索引结构.此方法有效减少了磁盘的访问次数,提高了查询的效率.  相似文献   

4.
将数据点的k最近邻(k-NN)距离作为孤立程度指标能够有效地发现数据集中的孤立点,但是基本算法需要O(N2)次数据点间的距离计算,不适用于大数据集.为此提出了一种利用度量空间中三角不等式的快速挖掘算法--提前修剪(ADVP).ADVP利用每次k-NN查询中保存的近邻点到被查询点的距离计算出近邻点的孤立程度上界.孤立程度上界小于已发现最弱孤立点的孤立程度的数据点可被修剪而无须进行k-NN查询.基于抽样方法优化了搜索次序以提高修剪效果.同时将ADVP自然地扩展为增量式算法.在标准大数据集上的实验结果表明,ADVP和现有算法相比明显节省了计算开销,具有更好的伸缩性;增量式ADVP能够有效地处理新增数据.  相似文献   

5.
k近邻查询算法是查询大规模空间数据的常用算法之一,使用Kd-Tree先构建大规模空间数据的索引,然后对搜索空间进行层次划分,再进行k近邻查询,能保证搜索的效率。但是,传统的Kd-Tree构建有两个缺点:使用测试数据点进行k近邻查询每次都需要回溯到根节点,影响了查询的效率;Kd-Tree使用split域对空间进行层次划分,空间划分为立方体(二维数据表现为矩形),多边形空间在相交判断时会出现没必要进行数据距离比较的多余空间,这样会影响查询的效率。针对这两个缺点,本文提出了相应的改进算法---RB算法。实验结果证明,该算法比传统的KD算法拥有更高的查询效率。本文的主要贡献有两点:(1)构建一种快速创建Kd-Tree索引来支持KNN算法进行大规模数据的分类查询操作。(2)改进传统的Kd-Tree索引构建方法,提出新的改进算法RB算法,提高KNN算法查询的效率。  相似文献   

6.
传统索引方法在高维情况下会面临维数灾难问题,基于向量近似的索引方法是有效的高维检索方法.对向量近似方法中k近邻搜索算法加以改进,应用到基于相关反馈的交互式图像检索系统中.根据反馈过程前后的距离变化特性,在进行k近邻搜索过程中,将上轮次的查询结果和用户反馈信息用作过滤信息,可减少特征向量的访问数量.在大容量真实图像数据库上的实验表明,将新算法应用干相关反馈过程的图像检索中,可提高k近邻搜索速度.  相似文献   

7.
针对查找DNA序列的相似序列问题,给出了建立索引和查找索引的数学模型,基于Hash算法,建立了依赖于k值大小的顺序索引模型和散列索引模型,特别对较大k值选用了DJBHash函数,有效的避免了Hash冲突问题。最后在硬件平台CPU为2.6GHz、内存为8G、操作系统为64位Windows 7的条件下,对100万条长度为100的DNA序列进行了测试,给出了不同k值下建立和查询索引的用时和占用内存情况,有效的解决了DNA序列的k-mer index问题。  相似文献   

8.
一种基于双重距离尺度的高维索引结构   总被引:1,自引:0,他引:1  
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构, 对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离, 并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明, 该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询.  相似文献   

9.
将核学习的方法应用到k最近邻算法中,提出了1种基于核的k最近邻算法.该算法通过引入核函数,将原空间中的样本映射到1个高维核空间中,突出了不同类别样本之间的特征差异,使样本变得线性可分,从而提高分类性能.并利用UCI数据库中的数据分别验证了k最近邻分类和核k最近邻分类算法的有效性.  相似文献   

10.
提出一种快速的反向k近邻查找算法,该方法利用现代计算机具有外存便宜、运行速度快的特点,预先计算数据之间的距离,并组织为数据索引块存储于外存,由计算机在空闲时自动进行维护.在进行反向最近邻查询时,只需读入相应的索引块,就可进行直接查询,其时间复杂度为O(N),而且不受k的影响.为减少索引块的读取时间,提出一种改进方法来有效地压缩索引块,仅用必要的二进制位来存储对象之间的距离,并将冗余减少到最低水平,提高了算法的效率.最后通过实验分析评估算法的有效性和效率.  相似文献   

11.
针对障碍空间中不确定对象的组k最近邻查询问题,提出了Pk OGNN(probabilistic k obstructed group nearest neighbor query)查询方法。Pk OGNN查询方法主要包括4个子算法:Compadist_o(),SpatialPru(),PruInterEnt()和PkOGNN(),这些子算法分别是集总障碍距离的计算方法、空间修剪方法、根据空间修剪方法进行R树中间结点修剪、最终精炼查询方法。所提Pk OGNN查询方法通过集成有效的修剪策略以便减少Pk OGNN的搜索空间,得到正确的k GNNs。理论研究和实验结果表明,所提方法具有较好的性能。  相似文献   

12.
基于小波变换的多分辨率高维图像检索方法   总被引:1,自引:0,他引:1  
为解决传统索引方法对高维数据索引时存在的维数灾难问题,提出一种多分辨率向量近似方法.该方法通过小波变换得到一种多分辨率数据结构,在低分辨率上建立低维空间内的距离计算方式.进行近邻搜索时,从低分辨率开始计算候选向量与查询向量之间的距离下限,通过与当前的近邻距离相比较,可以在低分辨率上过滤掉大多数候选向量,避免在高维空间内对其进行距离运算,从而降低运算复杂度.在大型高维图像数据库上的实验表明,该方法可以显著提高向量近似方法的查询效率.  相似文献   

13.
针对时空数据库中的连续移动对象的最近邻查询问题,提出COp KNN(continuous obstructed possible k-nearest neighbor)查询:在二维空间中,给定一个移动查询点q、一组移动查询对象集合P和一组多边形障碍物集合O,根据障碍距离的概念,查询q所有可能的k最近邻集合。由于移动对象本身的不确定性以及现实生活中障碍物的存在,已有的查询方式不再适用COp KNN查询。COp KNN查询包括三个子过程:根据可视图、R树和堆排序的概念,给出计算两点之间障碍距离(大于等于欧几里得距离)的方法;基于R树的查询方式查找在用户给定时间段内q所有可能的k最近邻结果集(初步结果,也叫候选集);采用Mindist(E,q)和候选集更新算法Updata C(pn)对k最近邻结果集进行剪枝,得到较为精确的k最近邻结果集。实验数据集和障碍物集均采用真实的数据集,理论研究和实验结果表明,该方法具有良好的效率。  相似文献   

14.
为提高逆k最近邻在度量局部密度时的区分度,提出动态逆k最近邻概念.利用泊松概率密度函数拟合逆k最近邻分布,并计算累积动态逆k最近邻局部密度;基于动态局部密度对数据对象进行排序,利用逆k最近邻域扩展算法生成聚类结构;依据动态局部密度和欧式距离设计聚类决策图,根据决策图找出聚类结构中的类间间断点,利用间断点将聚类结构直接划...  相似文献   

15.
时间序列数据的高维性是影响数据查询代价的主要因素,降维技术是时间序列数据查询优化的有效手段。原有降维技术近似体积的无界性,造成索引阶段不能充分实现点过滤,影响了查询效率。首先,利用近似体积有界的非线性降维技术解决了点过滤问题。然后,引入提前终止技术,减少了原始序列距离计算阶段的冗余计算。在此基础上,提出排序的子序列相似查询算法。实验结果表明,排序子序列相似查询方法具有较高的效率。  相似文献   

16.
Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能.分析了Lucene的索引文件结构和搜索排序算法,探讨了Lucene中计算文档与查询项相关度的向量空间模型(VSM).最后,通过实验验证了索引过程的建立以及如何提高索引性能.  相似文献   

17.
基于SR-树的空间对象反最近邻查询技术研究   总被引:1,自引:0,他引:1  
反最近邻查询是空间数据库的重要应用之一,是在最近邻查询基础上提出的一种新的查询类型,以往基于范围查询或最近邻查询的方法搜索影响集效率不高,本文在分析RNN查询的基本概念和存储区域的基础上,区别于R*-树,提出了基于SR-树的RNN查询方法,优化了空间对象的反最近查询性能,在高维空间查询上具有明显优势。  相似文献   

18.
为了解决传统分布式搜索引擎存在的搜索性能问题,从索引结构、查询算法方面改进了传统模型.提出了一种非集中的高并行化搜索模型,该模型按照文档主题对索引分类,对较长的倒排记录表采用位图结构,利用多线程技术对索引节点实现并行搜索算法(multi max score heap,MMSH).实验结果表明:改进模型中的索引分类方法与倒排表结构的位图策略,能够增强Merge层查询的针对性,降低Merge层节点的CPU和内存开销;在倒排表不能完全存入内存情况下,MMSH算法能够实现高度并行化查询,其查询效率高于经典的term-at-a-time算法,缩短了平均查找时间,提高了系统吞吐量.索引分类、位图结构以及并行查询算法能够避免查询的盲目性,改善了分布式搜索引擎的性能.  相似文献   

19.
针对不确定对象的可视最近邻查询问题,对不确定Voronoi图的性质进行分析,提出多层邻接生成点和多层不确定Voronoi区域等概念,给出判断概率可视最近邻的理论方法,并提出基于不确定Voronoi图的概率可视最近邻查询算法,该算法通过直接确定参与查询的概率可视最近邻的范围以及参与可视性判断的障碍集的范围,避免了索引遍历时大量的比较计算和剪枝操作,采用真实数据集和模拟数据集对提出的算法进行了性能分析,实验结果表明,提出的算法能够有效地处理不确定对象的可视最近邻查询.  相似文献   

20.
提出了一种针对固定网络中移动对象的时空索引2DSTIH及其相应的时空查询算法.2DSTIH采用降低时空数据维度的思想,使用Hilbert曲线将移动对象的3维运动空间(x,y,t)转换为2维的运动空间(x,t),将一个3维的时空索引转换为两个2维的子索引.这种2维时空索引机制降低了索引的数据维度,支持当前轨迹和历史轨迹的时空查询操作,并且有效的优化了窗口查询操作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号