首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 312 毫秒
1.
提出了基于K-means的四叉树与R-link树的混合结构树,提高了R-link树的查询性能,在K-means中采用均值—标准差确定初始聚类中心,提高了收敛速度,通过距离准则函数来优化K值,避免K值的盲目选取。与R-link相比空间开销代价有时略大,但换取了更高的性能,且数据量越多,此种结构的整体性能越好,适合于海量数据。  相似文献   

2.
基于K-means算法的高性能空间索引方法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出基于R-link树的快速空间索引结构,在该结构中引入K-means算法。在K-means中采用均值-标准差确定初始聚类中心,提高了收敛速度。通过距离准则函数来优化K值,避免K值的盲目选取。与R-link相比空间开销代价有时略大,但换取了更高的性能,且数据量越多,索引结构的整体性能越好。  相似文献   

3.
空间索引是空间数据库的关键组成部分,其性能的优劣直接决定着空间数据操作的效率。为此,在分析了现有各种空间索引的基础上,将分布并行处理技术与空间索引相融合,提出了一种DPsIR^+树。DPsIR^+树借助繁衍和返祖,动态分割空间槽,并将它们映射到多个节点机上。每个节点机再将其对应空间槽中的空间对象组织成R树,并将R树分裂成多个残枝,将残枝并行存入本地MultiDisk中;在内存中则按R-link组织空间对象,按R^+处理节点溢出。实验结果表明DPsIR^+树具有良好的查询特性。  相似文献   

4.
空间索引是空间数据库的关键组成部分,其性能的优劣直接决定着空间数据操作的效率。为此,在分析了现有各种空间索引的基础上,将分布并行处理技术与空间索引相融合,提出了一种 DPsIR~+树。DPsIR~+树借助繁衍和返祖,动态分割空间槽,并将它们映射到多个节点机上。每个节点机再将其对应空间槽中的空间对象组织成 R 树,并将R树分裂成多个残枝,将残枝并行存入本地 MultiDisk 中;在内存中则按 R-link 组织空间对象,按 R~+处理节点溢出。实验结果表明 DPsIR~+树具有良好的查询特性。  相似文献   

5.
空间索引是空间数据库的关键组成部分,其性能的优劣直接决定着空间数据操作的效率.为此,在分析了现有各种空间索引的基础上,将分布并行处理技术与空间索引相融合,提出了一种DPsIR+树.DPslR+树借助繁衍和返祖,动态分割空间槽,并将它们映射到多个节点机上.每个节点机再将其对应空间槽中的空间对象组织成R树,并将R树分裂成多个残枝,将残枝并行存入本地MultiDisk中;在内存中则按R-link组织空间对象,按R+处理节点溢出.实验结果表明DPslR+树具有良好的查询特性.  相似文献   

6.
空间数据库系统中R树的并发控制设计与实现   总被引:3,自引:0,他引:3  
夏英  彭大芹 《计算机工程》2002,28(7):242-244
R树是实现快速空间数据处理的重要索引结构之一,但由于其并发控制的复杂性,虽研究已久但仍然很少的真正地集成到商用数据库中。R-link树是为了实现并发控制而提出的一种R树结构的变化,但它仍然存在幻像等问题。文章分析了R-link树中存在的这一问题并通过设计一个基于内存的操作控制列表(Operation Control List.OCList)来预先避免可能造成幻像的并发操作,从而实现完全的并发控制,实验证明所提方案是正确的,低开支的,而且有利于提高系统性能。  相似文献   

7.
命名实体的网络话题K-means动态检测方法   总被引:1,自引:0,他引:1  
针对传统的网络话题检测方法在文本特征表示方面的不足及K-means聚类算法面临的问题,提出了一种基于命名实体的网络话题K-means动态检测方法.该方法对传统话题检测的特征表示方法进行了改进,用命名实体和文本特征词相结合表示文本特征,用命名实体对文本表示的贡献大小表示命名实体的权重;另外,利用自适应技术对K-means聚类算法中的K值进行自收敛,对K-means聚类算法进行了优化,利用K值的动态选取来实现网络话题的动态检测.实验结果表明,该方法较好地区分了相似话题,有效提高了话题检测的性能.  相似文献   

8.
《软件》2019,(5):167-170
典型的K-means算法利用手肘法选择合适的K值在实际项目中应用的较多,但是手肘法获取K值自动性低,以及面对海量数据的处理,效率上也有待提高。提出利用手肘法关系图初始点和末尾点连接的关系直线,求K值范围下直线y值与误差平方和的最大差值的方法,最大差值对应的K值为手肘法的最优肘点,由于手肘法需要多次迭代以及数据集稠密度对关系图的影响较小,提出利用数据集预抽样并且将程序部署在spark平台之上的方式自动获取手肘法的肘点K值,这样不仅根据此方法自动获取K-means最优K值而且提高了大数据集的处理效率。  相似文献   

9.
QR-树处理海量空间数据时,其深度和R-树内目录矩形的重叠面积会变大,导致查询效率降低。针对该问题采用K-means算法对索引对象进行聚类分析,构造新的聚类中心使其能处理具有多种形体的索引对象,并在QR-树中引入超结点存储聚类结果。提出一种QCR-树空间索引结构来提高查询效率,给出QCR-树的插入、删除和查询算法。实验结果表明QCR-树的查询性能优于QR-树,适用于海量数据。  相似文献   

10.
传统K-means算法除了对初始聚类中心的选择非常敏感,易收敛到局部最优解外,还存在着K值难以确定的问题,不合适的K值往往会得到较差的聚类结果。而K值问题也是聚类分析中的一个重要的研究方向,在粒子群聚类算法的基础上,结合K-means算法,提出了自适应K值的粒子群聚类算法。当算法收敛时,可通过比较不同K值时全局最优适应度值之间的关系来决定K值的增大与减小。实验表明改进的算法可以有效指导K值的选取,并且具有较好的聚类效果。  相似文献   

11.
为了加快[K]-means计算速度和寻找最优聚类子空间,使用特定的变换矩阵对数据进行投影,将特征空间划分为聚类空间和噪声空间,前者包含全部空间结构信息,后者不包含任何信息。将噪声空间舍弃,在聚类空间下进行[K]-means每一次迭代。算法不同于PCA [K]-means先降维再聚类,而是在迭代过程中达到筛选维度的效果,并将保留的维度反馈给下一次迭代,同时聚类空间的维度信息是自动发现的,没有引入额外的参数。实验证明AC [K]-means算法相较于已有同类型算法在准确度和计算时间方面都得到了大幅提升。  相似文献   

12.
一种基于R-树的空间索引结构   总被引:2,自引:0,他引:2       下载免费PDF全文
为了有效构建R-树,通过分析数据矩形的性质,结合改进的K-均值算法,提出一种用于构建R-树的数据矩形聚类新方法,给出基于R-树和四叉树的空间索引结构以及该空间索引结构的构造算法和节点插入算法。研究结果表明,该索引结构具有更紧凑的结构和更高的空间查询效率。  相似文献   

13.
一种改进的K—means聚类算法   总被引:1,自引:0,他引:1  
K—means算法是最常用的一种基于划分的聚类算法,但该算法需要事先指定K值、随机选择初始聚类中心等的缺陷,从而影响了K—means聚类结果的稳定性。针对K—means算法中的初始聚类中心是随机选择这一缺点进行改进,利用提出的新算法确定初始聚类中心,然后进行聚类,得出最终的聚类结果。实验证明,该改进算法比随机选择初始聚类中心的算法性能得到了提高,并且具有更高的准确性及稳定性。  相似文献   

14.
空间数据挖掘是数据挖掘的一个研究分支。空间聚类分析是空间数据挖掘的一个重要的研究领域。传统的K-均值方法用于聚类具有收敛速度快、算法实现简单等特点,但容易陷入局部最优,并对初始解敏感。遗传算法是一种全局搜索算法,但是收敛速度较慢。提出一种改进的遗传算法进行聚类,该算法通过全局搜索与局部搜索相结合,取得较好效果。实验表明:文中提出的算法在聚类分析中搜索到全局最优解(或近似全局最优解)的能力要优于经典的K-均值聚类算法,且局部收敛速度和全局收敛性能较好。  相似文献   

15.
R-Tree允许兄弟节点之间的相互重叠,具有多路查找的特点,而Hilbert R-Tree也不能有效降低子空间的相互重叠,直接影响查询效率。提出了一种基于混合聚类的空间索引算法,将K-means和K中心点引入索引结构,改变了经典K-means算法对初始聚类中心的随机选取,减少了叶节点的MBR面积和各个子空间的重叠。通过实验表明,该算法具有更快的响应速度和查询效率。  相似文献   

16.
Chen  Wei  He  Cenyu  Ji  Chunlin  Zhang  Meiying  Chen  Siyu 《Multimedia Tools and Applications》2021,80(14):21059-21083

Conventional algorithms fail to obtain satisfactory background segmentation results for underwater images. In this study, an improved K-means algorithm was developed for underwater image background segmentation to address the issue of improper K value determination and minimize the impact of initial centroid position of grayscale image during the gray level quantization of the conventional K-means algorithm. A total of 100 underwater images taken by an underwater robot were sampled to test the aforementioned algorithm in respect of background segmentation validity and time cost. The K value and initial centroid position of grayscale image were optimized. The results were compared to the other three existing algorithms, including the conventional K-means algorithm, the improved Otsu algorithm, and the Canny operator edge extraction method. The experimental results showed that the improved K-means underwater background segmentation algorithm could effectively segment the background of underwater images with a low color cast, low contrast, and blurred edges. Although its cost in time was higher than that of the other three algorithms, it none the less proved more efficient than the time-consuming manual segmentation method. The algorithm proposed in this paper could potentially be used in underwater environments for underwater background segmentation.

  相似文献   

17.
聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索中心点,依据中心点查找数据集个数,为K-means聚类提供参数。从而克服了K-means需要人工设定聚类个数的问题,同时具有较好的全局收敛性。实验证明KSNN算法比K-means、粒子群K-means(pso)以及多中心聚类算法(MCA)有更好的聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号