首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
寻找查询点的最近邻是信息处理相关领域的主要任务之一。在数据规模较大时需要采用快速检索算法,常用的快速检索算法主要是基于树的算法,但是当数据点维数较高时,这些算法的效率会变低。位置敏感哈希是当前解决高维搜索的最快的算法,文章对汉明空间、欧式空间下的位置敏感哈希算法的实现方案进行了详细分析,对算法中数据点冲突概率、空间时间消耗、参数调整对算法性能的影响进行了详尽的研究和试验,最后讨论算法的优点和缺点,说明了算法应用于视觉聚类的可能性。  相似文献   

2.
连续最近邻查询是空间数据库中最重要的查询之一,在地理信息系统和位置定位服务等领域有重要应用.给定一个空间数据集P和查询线段q,连续最近邻查询返回结果<R,T>,其中T是一个间隔,R是这个间隔中所有点的最近邻.已有的连续最近邻查询算法无法实现I/O的优化,为此,提出一种优化的连续最近邻查询方法,该方法具有较高的I/O效率,不仅在减少磁盘访问数量方面进行优化,同时也提高CPU的性能.  相似文献   

3.
基于Voronoi图的反向最近邻查询方法研究   总被引:4,自引:0,他引:4  
为了解决数据集中数据点的反向最近邻问题,利用Voronoi图及空间分割区域的性质计算查询点的反向最近邻,通过Voronoi图的特性可免去每次都计算数据集中给定查询点的最近邻的步骤,每次查询可过滤出少数的几个数据点并对其进行反向最近邻的判断.给出了在数据点被加入或删除时,对查询点的反向最近邻变化情况的判断方法与算法.为了便于数据库查询,设计了相应的空间存储数据结构.比较分析表明,该方法较适用于平面及复杂曲面上的数据点的反向最近邻的查询.  相似文献   

4.
现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多或者未能充分利用距离信息导致搜索时内存开销巨大.为此,提出精简排列阵(reduced permutation array, RPA)的度量空间recall@R近似最近邻搜索方法.对于全体数据元素,RPA预先选择k个支撑点,对每个数据元素仅存储离该数据元素最近的l个(l?k),并将所有元素的支撑点序列构建为一个数组结构.在搜索过程中,利用一种得分函数,该函数基于查询对象到各个支撑点的距离来近似计算数据元素到查询对象的距离.同时,维护一个有界最小堆,以保存R个候选结果数据元素.RPA具有结构简单、内存效率高和可扩展性强等特点.实验结果表明,在相同召回率的情况下,与排列索引(permutation-based index, P-index)相比,RPA平均具有高达3倍的内存压缩比.研究结果可在内存资源有限的单机环境下提供一种有效的...  相似文献   

5.
在传统的主成分分析特征提取中,直接求解特征空间是很困难的,同时也是非常浪费资源,为优化这一问题,该文提出了改进的主成分分析特征提取。在人脸特征提取中,同时还选择了适当的主分量数,用于提高分类识别的速度。在人脸分类识别的过程中,分类策略选取最邻近分类器,通过计算最短欧几里得距离来分类识别测试样本。通过十折交叉验证方法验证了改进的主成分分析和最邻近分类的有效性。  相似文献   

6.
通过引入紧束缚近似理论,使用Matlab计算了石墨烯的能带和π能带图.结果表明,考虑最近邻原子影响,在K—Г—M—K方向的全能带图中,观察到了能带的简并特性及能带间的跳跃,与其他方法(如第一原理)相符.在正交基矢下,π能带(价带和导带)具有完全的对称性,加入轨道重叠后(即非正交基矢),对称性被破坏,表现为价带靠近费米面,导带远离费米面,从能量的位移上可以发现,远离比靠近的趋势更为明显.  相似文献   

7.
针对障碍空间中不确定对象的组k最近邻查询问题,提出了Pk OGNN(probabilistic k obstructed group nearest neighbor query)查询方法。Pk OGNN查询方法主要包括4个子算法:Compadist_o(),SpatialPru(),PruInterEnt()和PkOGNN(),这些子算法分别是集总障碍距离的计算方法、空间修剪方法、根据空间修剪方法进行R树中间结点修剪、最终精炼查询方法。所提Pk OGNN查询方法通过集成有效的修剪策略以便减少Pk OGNN的搜索空间,得到正确的k GNNs。理论研究和实验结果表明,所提方法具有较好的性能。  相似文献   

8.
9.
为进一步提升服务组合性能,提出将词法多重散列与包容语义相结合的快速服务查找法.该方法有如下特点:将服务描述模型分解为不同粒度的词法和语义子块,同时将服务查找过程转换为按词法子块粒度递增的多重散列过程,利用子块间的包容语义消解散列冲突,实现降低查找失败时间至最低;所建立的服务库一方面通过缩减服务组合路径搜索空间降低查找成功时间,另一方面为设计高效组合路径查找算法提供了基础;可提供近似常数时间的原子服务查找和服务建库过程.实验证明该方法查找准确,较当前权威组织提供的基准服务查找方法效率提升显著,并具有查找时间几乎与服务库规模无关的良好稳定性.  相似文献   

10.
针对点云数据冗余和配准精度低的问题,提出了一种基于超体素的双向最近邻距离比匹配的配准方法。首先,利用超体素提取了具有稳定结构的目标特征点,同时提出了利用点云厚度分层进行非迭代的阈值去噪方法;然后,利用FPFH进行特征描述,提出了双向最近邻距离比方法对点云进行了初始配准;最后,提出了基于双级阈值的点云精确配准方法。采用标准数据库模型进行仿真分析,验证了算法的有效性。结果表明:本方法能有效剔除漂移噪声体素,配准精度高,鲁棒性强。与其他方法对比,在配准时间相近时,本文算法的配准精度提高74.2%;在噪声占比为6%和10%时,配准精度均提高67%以上。  相似文献   

11.
提出一种快速的反向k近邻查找算法,该方法利用现代计算机具有外存便宜、运行速度快的特点,预先计算数据之间的距离,并组织为数据索引块存储于外存,由计算机在空闲时自动进行维护.在进行反向最近邻查询时,只需读入相应的索引块,就可进行直接查询,其时间复杂度为O(N),而且不受k的影响.为减少索引块的读取时间,提出一种改进方法来有效地压缩索引块,仅用必要的二进制位来存储对象之间的距离,并将冗余减少到最低水平,提高了算法的效率.最后通过实验分析评估算法的有效性和效率.  相似文献   

12.
In order to implement quick and effective search, save the storage space and improve the poor performance of affinity relationshaps between high dimensional data and its codes in image retrieval, a new linear embedding hashing is proposed by introducing the preserving similarity. First, the whole data set is clustered into several classes, and then the similarity predicted function is used to maintain affinity relationships between high dimensional data and its codes so as to establish the objective function. By minimizing the margin loss function, the optimal embedded matrix can be obtained. Compared with the existing classic hashing algorithm, experimental results show that the performance of the linear embedding hash algorithm is superior to the other binary encoding strategy on precision and recall.  相似文献   

13.
移动对象的动态反向最近邻算法   总被引:1,自引:0,他引:1  
针对现有的算法,很多观点都是基于静态对象的,提出以TPR-tree为索引结构,用现有的半平面修剪策略进行改进的,利用剩余MBR的对角线判断是否保留MBR的方法,使原修剪策略性能优化,并采用过滤提纯的方法来获取移动查询点的反向最近邻,实现了移动对象的动态反向最近邻查询.  相似文献   

14.
时空数据库中基于TPR-树的反向最近邻查询   总被引:1,自引:0,他引:1  
为研究动态环境下解决反向最近邻查询的算法,采用TPR-树索引结构给出了解决动态环境下的最近邻查询算法,并提出反向最近邻查询算法.该算法可有效解决平面上连续移动点的反向最近邻查询.  相似文献   

15.
基于“同类相近”的思想,构建了一种改进的最短距离聚类算法——最近邻优先聚类算法NNPC.该算法可以快速获得不同层次的高质量聚类,进而找到满足要求的闽值参数和聚类,并能够高效处理以任意形状分布的具有噪声数据的大数据量高维数据,且用户需要的先验知识少.通过3个定理的提出和证明,体现算法的先进性.  相似文献   

16.
k近邻查询算法是查询大规模空间数据的常用算法之一,使用Kd-Tree先构建大规模空间数据的索引,然后对搜索空间进行层次划分,再进行k近邻查询,能保证搜索的效率。但是,传统的Kd-Tree构建有两个缺点:使用测试数据点进行k近邻查询每次都需要回溯到根节点,影响了查询的效率;Kd-Tree使用split域对空间进行层次划分,空间划分为立方体(二维数据表现为矩形),多边形空间在相交判断时会出现没必要进行数据距离比较的多余空间,这样会影响查询的效率。针对这两个缺点,本文提出了相应的改进算法---RB算法。实验结果证明,该算法比传统的KD算法拥有更高的查询效率。本文的主要贡献有两点:(1)构建一种快速创建Kd-Tree索引来支持KNN算法进行大规模数据的分类查询操作。(2)改进传统的Kd-Tree索引构建方法,提出新的改进算法RB算法,提高KNN算法查询的效率。  相似文献   

17.
交叉覆盖算法分类时着重在于两类的交界部分,混杂在另外一类中往往无助于提高分类器的效率,反而会增加分类器的计算负担。本文提出一种基于交叉覆盖算法的最近邻交叉覆盖算法(NN-ACA):对进行训练的原始样本数据进行预处理,删除这些不同类的最近邻点,得到精简后的样本集,再对该样本集使用交叉覆盖算法。文章在介绍算法的同时,给出了相关实验数据,并对其和SVM进行了讨论,结果表明NN-ACA在一定的样本规模表现了速度和分类正确性上的优越性。  相似文献   

18.
基于SR-树的空间对象反最近邻查询技术研究   总被引:1,自引:0,他引:1  
反最近邻查询是空间数据库的重要应用之一,是在最近邻查询基础上提出的一种新的查询类型,以往基于范围查询或最近邻查询的方法搜索影响集效率不高,本文在分析RNN查询的基本概念和存储区域的基础上,区别于R*-树,提出了基于SR-树的RNN查询方法,优化了空间对象的反最近查询性能,在高维空间查询上具有明显优势。  相似文献   

19.
社会搜索涉及众多研究领域,首先对比分析了社会搜索与传统搜索模式的关系,阐述了社会搜索的定义;其次介绍了社会搜索的理论基础,并对社会搜索的研究现状和目前采用的关键技术进行了归纳总结;分析了社会搜索目前面临的主要问题,并提出了社会搜索未来的发展方向,试图为该研究领域勾画出一个较为全面和清晰的概貌.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号