首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
发现两类对象的相互k最近邻居可为工作匹配、大学选择等应用提供决策。现有的方法主要处理单度量空间(如L2 norm),这些方法有可能导致不公平的匹配。形式化多度量空间的相互最近邻问题,提出基于空间索引的多度量空间下的相互k最近邻算法。利用人工数据集,测试了大量的参数设置下的算法性能,结果表明提出的算法优于可选的直接算法。  相似文献   

2.
针对现有聚类算法计算复杂度普遍较高的问题,提出了一种基于定位的方法。该算法采用空间定位的方法将数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任一数据点;通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程。在电信数据集上的实验结果表明,算法的时间复杂度降至O(N)级别。  相似文献   

3.
度量空间一种自底向上索引树构造算法   总被引:1,自引:0,他引:1  
在多媒体或复杂对象数据库中,相似性搜索是一种非常重要的操作,这些操作一般可以归结为度量空间的相似性查询.提出一种新的度量空间索引数据结构(bu-tree),它是基于自底向上的分层聚类来构造索引结构,而传统的度量空间数据结构大部分是基于自顶向下构造的方法.相对于传统的构造方法,bu-tree可以在更小的索引半径内包含更多的对象,这样有利于查询的筛选.给出了bu-tree的构造算法以及相应的范围查询算法.实验表明,bu-tree的性能好于sa-tree,特别是在度量空间不是均匀分布或者查询具有较低的选择度情况下.  相似文献   

4.
现有反k邻域的流数据离群点挖掘算法存在一些不足之处,即需要遍历每个数据对象,计算复杂度较高,稳定性较差。为了解决这些问题,本文提出一种改进的基于反k近邻的离群点检测算法OL-ORND。该算法采用细胞邻域思想,加入伪反k邻域点概念(反k邻域为空集的点对象),增加了算法的严密性,从而大大提高了算法的效率和准确率。实验表明,算法具有较好的性能。  相似文献   

5.
作为数据挖掘领域中一项重要的数据预处理技术,特征选择算法能够有效应对高维数据带来的“维数灾难”问题.然而,如何对高维的混合数据进行特征选取仍然是当前研究的重点和难点之一.基于邻域关系的邻域粗糙集模型因其能够处理名词型属性与数值型属性并存的混合数据,已成功应用于混合数据的特征选择.但是,现有邻域粗糙集对混合数据邻域关系的度量,仍然是基于等价关系的名词型数据划分与基于相似关系的数值型数据划分的简单融合,在利用模型划分的邻域空间和预定义的评价函数对高维混合数据进行特征选取时,适应性较差.为此,在邻域粗糙集模型的基础上,提出一种改进的邻域空间构造方法,并设计相应的邻域空间度量公式作为判别指标,自适应地调节邻域空间下邻域粒的大小;为了准确地表征高维混合数据邻域空间的判别能力,设计一种考虑边界数据和邻域空间大小的评价函数;在此基础上,提出一种启发式的高维混合数据特征选择算法.通过UCI标准数据集验证所提出算法的有效性.  相似文献   

6.
王伟  毕笃彦  熊磊 《计算机应用》2010,30(12):3301-3303
黎曼流形学习(RML)是一种全局算法,但其不能较好地保持数据局部邻域的几何性质。为解决这个问题,提出一种基于黎曼流形学习(RML)的多结构算法。先对数据集进行主成分分析(PCA)投影,再构造邻域图,然后把整个数据集分为两个部分求低维嵌入坐标,对于基准点的k近邻,采用能保持其和近邻点局部性质的权值矩阵得到低维嵌入;对于其他点仍采用RML算法,使其达到既能维持数据点的全局结构,又能最大限度地保持其局部几何性质的目的。实验结果验证了该算法的有效性和实时性。  相似文献   

7.
杨斌  范媛媛  王继东 《计算机应用》2011,31(10):2717-2720
为了有效地多分辨率简化点云模型,首先,采用均匀栅格法建立点云模型的拓扑关系,计算每个数据点的k邻域;然后,通过建立点云模型中数据点的协方差矩阵求得这些点的法向量,并且进行法向重定向,使所有法向量的方向都指向点云模型的外部;最后,通过衡量数据点对Laplace-Beltrami算子特征值频谱的影响,得到与数据点k邻域及其法向量相关的量化该点重要性的度量公式,随后调节控制因子的取值,实现点云模型的多分辨率简化。实验结果表明,该算法具有简化率高、保留点云模型的微小细节特征信息、简化速度快、稳定性强的特点。  相似文献   

8.
研究了基于空间数据仓库的一种决策分析工具--空间在线分析处理(OLAP)的支撑技术.将普通数据立方体与空间数据立方体进行比较,提出空间数据立方体的维和度量的建模方法,解决了空间维与非空间维、空间度量与数值度量的集成建模问题.  相似文献   

9.
保留边界的点云简化方法   总被引:3,自引:0,他引:3  
针对点云简化算法中边界点丢失的问题,提出了一种保留边界的三维散乱点云的非均匀简化算法。首先利用kd-tree建立散乱数据点云的空间拓扑关系,计算出每个数据点的k邻域;然后针对目前依据点云分布均匀性算法提取边界效率低的问题,提出一种改进的点云边界点判定算法;最后保留所有边界点,对非边界点,根据曲面变分值和k邻域点已保留比例,进行点云的非均匀简化。实验结果表明,该算法精度高,空间复杂度低,而且简化后点云边界保留完整。  相似文献   

10.
袁钟  冯山 《计算机应用》2018,38(7):1905-1909
针对离群点检测中传统距离法不能有效处理符号型属性和经典粗糙集方法不能有效处理数值型属性的问题,利用邻域粗糙集的粒化特征提出了改进的邻域值差异度量(NVDM)方法进行离群点检测。首先,将属性取值归一化并以混合欧氏重叠度量(HEOM)和具有自适应特征的邻域半径构建邻域信息系统(NIS);其次,以NVDM构造对象的邻域离群因子(NOF);最后,设计并实现了基于邻域值差异度量的离群点检测(NVDMOD)算法,该算法在计算单属性邻域覆盖(SANC)的方式上充分利用有序二分和近邻搜索思想改进了传统的无序逐一计算模式。在UCI标准数据集上与现有离群点检测算法——邻域离群点检测(NED)算法、基于距离的离群点检测(DIS)算法和K最近邻(KNN)算法进行了实验对比、分析。实验结果表明,NVDMOD算法具有更好的适应性和有效性,为混合型属性数据集的离群点检测提供了一条更有效的新途径。  相似文献   

11.
超平面覆盖问题是计算几何领域中一类典型的NP难问题,在实际生活中有着广泛的应用.针对NP难问题的难解性,人们提出了一些传统的方法用来求解这些NP难问题.但由于这些方法具有各自的局限性,不能满足实际应用中的各种需求,人们从新的理论角度为固定参数可解的NP难问题设计参数算法.通过深入分析直线覆盖问题(超平面覆盖问题的一个特例)的结构特征,并利用深度有界搜索树的方法,提出了一个时间复杂度为O(k3(0.736k)k+nlogk)的确定性参数算法,极大地改进了当前最好的结果O((k/2.2)2k+nlogk).通过对上述算法在高维空间中的进一步扩展,提出了关于超平面覆盖问题时间复杂度为O(dkd+1(dk)!/((d!)kk!)+nd+1)确定性参数算法,对当前的最好结果O(kd(k+1)+nd+1)有较大改进.  相似文献   

12.
广域网中的快速组播树生成算法   总被引:1,自引:0,他引:1  
在组播树生成算法中,MPH(minimum path cost heuristic)的费用性能几乎是最好的,但它的计算时间相对较长,提出了两种新的组播树生成算法:TNS-MPH(tree-mode started minimum-cost path heuristic)和NTDS-MPH(non-tree-destination started minimum-cost path heuristic).同时提出了一种使节点平均度非常精确的随机网络产生模型。新算法的仿真结果表明,新算法用较少的费用性能恶化来换取更快的计算速度。新算法比SCTF(selective closest terminal first)算法有更好的扩展性。  相似文献   

13.
胡沁 《计算机应用研究》2020,37(11):3307-3311
节点加权的Steiner树问题是组合优化中一个经典的NP-hard问题,现有算法研究该问题时存在时间复杂性高或无法得到最优解的缺点。针对现有算法的不足,提出了一个基于降阶技术的回溯算法。首先研究该问题的数学性质,利用数学性质对该问题进行降阶以缩小问题的规模;接着提出上界子算法和下界子算法,利用上下界子算法对该问题的解空间树进行剪枝,提高搜索效率;最后利用上下界子算法和数学性质设计了一个回溯算法求解该问题。示例分析以及实验的结果表明,该算法不仅时间复杂性较低而且可以得到问题的最优解。  相似文献   

14.
In this paper, we consider the fixed-charge transportation problem (FCTP) in which a fixed cost, sometimes called a setup cost, is incurred if another related variable assumes a nonzero value. To tackle such an NP-hard problem, there are several genetic algorithms based on spanning tree and Prüfer number representation. Contrary to the findings in previous works, considering the genetic algorithm (GA) based on spanning tree, we present a pioneer method to design a chromosome that does not need a repairing procedure for feasibility, i.e. all the produced chromosomes are feasible. Also, we correct the procedure provided in previous works, which designs transportation tree with feasible chromosomes. We show the previous procedure does not produce any transportation tree in some situations. Besides, some new crossover and mutation operators are developed and used in this work. Due to the significant role of crossover and mutation operators on the algorithm’s quality, the operators and parameters need to be accurately calibrated to ensure the best performance. For this purpose, various problem sizes are generated at random and then a robust calibration is applied to the parameters using the Taguchi method. In addition, two problems with different sizes are solved to evaluate the performance of the presented algorithm and to compare that performance with LINGO and also with the solution presented in previous work.  相似文献   

15.
研究了由MSN节点组成的应用层组播网络,讨论了度约束最小直径生成树(D-MDST)问题,并给出了求解该问题的BCT算法。提出了一种新的生成树编码方法——过程控制编码,该编码将启发式算法与遗传算法结合起来且具有编码简单、译码方便、适用常规遗传算子等优点。给出了基于该种编码的遗传算法,并将BCT算法作为过程控制编码的译码器。仿真结果表明了该遗传算法的有效性。  相似文献   

16.
李慧  张治国 《计算机工程》2010,36(20):241-243
射频识别技术中存在标签冲突问题,通常采用定长标签的反碰撞识别方法来解决。针对不定长标签的反碰撞识别,设计一种对RFID标签进行识别的高效二进制树形反碰撞算法——U-算法。模拟实现的测试与分析结果表明,U-算法具有二进制树形算法的优点,能达到41.67%的系统识别效率。  相似文献   

17.
通过优化物流的运输网络,可以有效地降低物流成本。集中配送的物流网络优化问题可以转换成求解节点带权的Steiner最小树问题,这是一个NP-hard问题。运用参数理论,提出一种新的启发式解决算法P-NSMT。算法的思想是:首先尽可能只利用终端节点构造一棵连通的最小生成树,然后逐步向树中添加能减少生成树总权值的Steiner节点,最终生成一棵节点总数不超过参数k的Steiner最小树。实验表明,与同类型其他算法相比,P-NSMT算法具有更好的准确性和时间效率,特别适应于网络规模大、终端配送节点数目较少的物流网络。  相似文献   

18.
移动自组网中一种网络生存时间最优的广播算法   总被引:1,自引:0,他引:1  
移动自组网中广播操作的网络生存时间问题一直是备受关注的热点研究问题.现有的研究已经证明,基于最小生成树算法的广播算法能够最优地解决网络生存时间问题.但是,这些研究工作都是基于静止的网络拓扑,从而不适用于一些实际的网络拓扑动态变化的应用场景,如军事通信应用等.因此,针对节点移动导致的网络拓扑变化的场景,本文提出了一种移动...  相似文献   

19.
王璐  刘晓清  何震瀛 《计算机工程》2022,48(2):79-85+91
查询文本中频繁出现的短语可快速掌握文本内容,然而传统频繁词序列挖掘算法面向挖掘任务时的时间复杂度较高,无法满足频繁更换查询条件及快速获得反馈的查询需求。利用基于频率树的快速频繁词序列挖掘算法(TS_Mining),在保持后缀树线性构造时间的情况下实现文本集合中频繁词序列的查询,并采用树型索引结构避免多次扫描文本集合,降低算法时间复杂度。针对连续时间区间内的频繁词序列查询问题,提出改进的剪枝挖掘算法(TS_Pruning),通过减少频率树的扫描范围进一步提高挖掘效率。实验结果表明,TS_Mining与TS_Pruning算法的运行时间相比经典Apriori挖掘算法约减少了2个数量级,具有更高的频繁词序列挖掘效率。  相似文献   

20.
XML数据类型验证算法的改进   总被引:2,自引:1,他引:1       下载免费PDF全文
介绍几种XML Schema类型验证算法,并对其中基于树自动机的算法进行研究,针对它在验证嵌套复杂类型XML文档过程中存在的问题,提出一种改进算法,为每个终结符增设一个处理状态标志,从而对以XML文档表示的数据类型进行验证。通过实验测试其性能,结果表明该算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号