首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 146 毫秒
1.
基于改进演化算法的空间数据聚类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
分析空间数据的特点和用常规方法进行空间数据聚类分析的难点与不足,提出一种基于改进的演化算法空间数据聚类方法——SDCEA。解决用传统方法进行空间数据聚类分析时存在的问题,增强聚类分析方法的灵活性和有效性。实验结果表明,对于空间数据的聚类分析问题,该算法具有很好的性能。  相似文献   

2.
带障碍约束的遗传K中心空间聚类分析   总被引:1,自引:0,他引:1       下载免费PDF全文
空间聚类分析是空间数据挖掘中的一个重要研究课题。传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性。讨论了带障碍约束的空间聚类问题,研究了一种基于遗传和划分相结合的带障碍约束空间数据聚类分析方法,设计了一个带障碍约束的遗传K中心空间聚类分析算法。对比实验表明,该方法兼顾了局部收敛和全局收敛性能,考虑到了现实障碍物对聚类结果的影响,使得聚类结果更具有实际意义,其结果优于传统K中心聚类及单纯的遗传聚类,不足之处是其计算速度相对较慢。  相似文献   

3.
基于模糊c-means算法的空间数据分类和预测   总被引:2,自引:0,他引:2  
空间分类和预测是空间数据挖掘中一个非常重要的方法,但对它们的研究目前尚处于初始阶段.通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊c-means算法的空间数据分类和预测的方法(SFCM),该方法首先用模糊c-means方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊c-means算法进行空间聚类时加入了空间信息,然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类,最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值,理论分析和实验结果表明,该算法是有效可行的.  相似文献   

4.
一个用于空间聚类分析的遗传K-均值算法   总被引:13,自引:0,他引:13  
空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K-均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验表明,其结果优于传统K-均值聚类方法及单纯的遗传算法聚类。  相似文献   

5.
随着空间数据挖掘技术和GIS的发展与结合,人们逐渐将空间数据挖掘技术应用于GIS的很多相关领域.聚类分析是空间数据挖掘的一种方法,聚类分析能从空间数据库中直接发现一些有用的聚类结构.为了实现空间复杂地理对象的聚类分析,本文引入了一种空间聚类算法,并将其应用于土地规划.在具体的模拟试验中,利用该算法将相邻的并且符合选取条件的空间目标聚类成一类,实现了能够发现任意形状、并满足特定约束条件的聚类.  相似文献   

6.
聚类分析是空间数据挖掘的一种方法,聚类算法能从空间数据库中直接发现一些有用的聚类结构.为实现空间复杂地理对象的聚类分析,文中给出了GIS及空间聚类分析技术,介绍了一种基于GIS的空间位置关系聚类分析算法.该算法按照空间相邻关系,将空间相邻的空间目标聚类成一类.在具体应用实例中利用本聚类算法将空间上相邻的大片阵地地域连成整块地域,并去掉了不符合条件的小块地域,形成阵地聚类,取得了满意的效果,实现了能够发现任意形状、并满足特定约束条件的聚类.  相似文献   

7.
基于GIS的空间位置关系聚类研究与应用   总被引:6,自引:0,他引:6  
李宁宁  刘玉树 《微机发展》2004,14(6):8-9,12
聚类分析是空间数据挖掘的一种方法,聚类算法能从空间数据库中直接发现一些有用的聚类结构。为实现空间复杂地理对象的聚类分析,文中给出了GIS及空间聚类分析技术.介绍了一种基于GIS的空间位置关系聚类分析算法。该算法按照空间相邻关系,将空间相邻的空间目标聚类成一类。在具体应用实例中利用本聚类算法将空间上相邻的大片阵地地域连成整块地域,并去掉了不符合条件的小块地域,形成阵地聚类,取得了满意的效果.实现了能够发现任意形状、并满足特定约束条件的聚类。  相似文献   

8.
数据挖掘空间聚类   总被引:1,自引:1,他引:0  
聚类分析在数据挖掘领域中得到了广泛的应用,对空间数据的聚类是其中的一个重要研究方向。文章提出了对空间数据聚类的6个标准,并基于这6个标准对一些传统的空间数据聚类算法作了分析比较。在分析的基础上指出没有一种老的算法能同时处理大量数据点、高维数据和多噪声的问题。接着对近年来改进或创新的聚类算法作了简要分析,并对未来发展方向进行了简要展望,目的主要是便于研究者全面了解和掌握空间数据聚类的现有算法,发现更高性能的聚类算法,也使用户能方便快速地找到适合特定问题的聚类方法。  相似文献   

9.
空间聚类研究   总被引:2,自引:0,他引:2  
聚类算法是数据挖掘中的关键技术,聚类技术在模式识别、图像处理等领域有广泛应用,随着对聚类算法更广泛深入的研究,产生了许多不同的适用于空间数据挖掘的聚类算法.描述了数据挖掘领域中对聚类分析的典型要求,介绍了空间数据挖掘中近几年常用的聚类方法,并通过基于评价聚类算法好坏的标准,从多个方面对这些算法性能进行比较分析,方便人们较容易找到一种适用于特定问题的聚类算法,最后对未来发展进行了展望.  相似文献   

10.
基于不确定性的空间聚类   总被引:8,自引:0,他引:8  
空间数据挖掘是指从空间数据库(空间数据仓库)中提取用户感兴趣的空间的和非空间的模式和规则的过程,空间聚类是空间数据挖掘最基本的任务。本文首先分析了空间数据挖掘过程中的不确定性,并以空间聚类为例具体分析空间聚类过程中的数据预处理方法。在此基础上,以EM算法为基础,顾及空间聚类的随机性和模糊性以及基于Delaunay图的空间对象的空间邻近关系,构建了基于不确定性的空间聚类算法。  相似文献   

11.
在处理海量数据集时,由于单台计算机的处理能力有限,利用传统的聚类算法难以在有效的时间内获得聚类结果。在基于密度和自适应密度可达聚类算法的基础上,提出一种并行聚类算法。理论和实验结果证明该算法具有接近线性的加速比,能够有效地处理大规模的数据集。  相似文献   

12.
Clustering in very large databases based on distance and density   总被引:8,自引:0,他引:8       下载免费PDF全文
Clustering in vergy large databases or data warehouses,with many applications in areas such as spatial computation,web information coollection,pattern recognition and econmic analysis,is a huge task that challenges data mining researches.Current clustering methods always have the problems:1)scanning the whole databased leads to high I/O cost and expensive maintenance(e.g.,R^*-tree);2)pre-specifying the uncertain parameter k,with which clustering can only be refined by trial and test many times;3) lacking high efficiency in treating arbitrary shape under very large data set environment.In this paper,we first present a new hybrid-clustering algorithm to solve these problesm,This new algorithm,which combines both distance and density strategies,can handle any arbitrary shape clusters effectively.It makes full use of statistics information in mining to reduce the time complexity greatly while keeping good clustering quality.Furthermore,this algorithm can easily eliminate noises and inentify outliers.An experimental evaluation is performed on a spatial database with this method and other popular clustering algorithms(CURE and DBSCAN).The results show that our algorithm outperforms them in terms of efficiency and cost,and even gets much more speedup as the data size scales up much larger.  相似文献   

13.
谢川 《计算机科学》2016,43(6):229-232
大数据聚类过程是一个随机的非线性处理过程,具有很高的不确定性。 由于传统方法需要先验知识进行学习,不能很好地适应大数据的实时变化情况,无法有效实现大数据聚类,因此提出一种基于混沌关联特征提取的大数据聚类算法。分析了传统方法的弊端,通过重构相空间建立了一个多维的状态空间向量与混沌轨迹,使原系统中很多几何特征量保持不变,为分析原系统的混沌特征提供有效依据。将平均互信息量取第一个最小值时的横坐标所指的时间延迟作为重构相空间的最佳时间延迟,采用虚假最近邻点算法对最佳嵌入维数进行选择。将提取的关联维数这一特征量作为大数据聚类的混沌特征量,依据提取的混沌关联维特征对大数据进行聚类。仿真实验表明,所提算法能够有效提高数据的聚类效率,减少能耗,是一种有效的数据聚类方法。  相似文献   

14.
自适应熵的投影聚类算法   总被引:1,自引:0,他引:1  
受“维度效应”的影响,许多传统聚类方法运用于高维数据时往往聚类效果不佳。近年来投影聚类方法获得广泛关注,其中软子空间聚类法更是得到了广泛的研究和应用。然而,现有的投影子空间聚类算法大多数均要求用户预先设置一些重要参数,且未能考虑簇类投影子空间的优化问题,从而降低了算法的聚类性能。为此,定义了一种新的优化目标函数,在最小化簇内紧凑度的同时,优化每个簇所在的子空间。通过数学推导得到了新的特征权重计算方法,并提出了一种自适应的“均值型投影聚类算法。该算法在聚类过程中,依靠数据集自身的相关信息及推导获得的公式动态地计算各优化参数。实验结果表明,新算法通过对投影子空间的优化改善了聚类质量,其性能较已有投影聚类算法有了明显提升。  相似文献   

15.
传统的数据聚类处理主要采用基于聚类中心的方式,但其存在一些限制,例如需要预先确定聚类中心的数量,并对数据的分布形态有一定的要求。针对这一问题,本论文选择基于密度聚类算法作为解决方案,重点研究了电力设备位置信息的聚类问题。在介绍密度聚类原理和常用算法的基础上,分析了电力设备位置信息的特点和处理方法,介绍了OPTICS、HDBSCAN和DBSCAN三种密度聚类算法的实现步骤,并与传统的K-mean聚类算法进行比较,通过实验设计和结果分析,验证了密度聚类方法的有效性和适用性。最后,通过应用案例分析,探讨了这些方法在电力系统分析中的应用实例和价值。研究结果表明,基于密度聚类算法的电力设备位置信息聚类方法可以有效地帮助电力系统实现数据的快速分析,具有重要的理论和应用价值。  相似文献   

16.
在大数据量的环境下,传统空间数据的空间关系仅描述两个空间物体,从而出现数据存储冗余,检索速度慢等问题。提出改进的聚类算法对空间物体聚类,再在聚类结果的基础上表示空间物体的方向关系。提出了基于密度的K-均值算法和空间聚类与方向关系融合的新方法。所提方法增强了空间数据库对空间数据对象的空间方向关系的智能处理能力,节省了存储空间,提高了数据的查询速度。  相似文献   

17.
目的 平行坐标是经典的多维数据可视化方法,但在用于地理空间多维数据分析时,往往存在空间位置信息缺失和空间关联分析不确定等问题。对此,本文设计了一种有效关联平行坐标和地图的地理空间多维数据可视分析方法。方法 根据多维属性信息对地理空间位置进行聚类分析,引入Voronoi图和颜色明暗映射对地理空间各类区域进行显著标识,利用平行坐标呈现地理空间多维属性信息,引入互信息度量地理空间聚类与属性类别的相关性,动态地确定平行坐标轴排列顺序,进一步计算属性轴与地图之间数据线的绑定位置,对数据线的布局进行优化处理,降低地图与平行坐标系间数据线分布的紊乱程度。结果 有效集成上述可视化设计及数据分析方法,设计与实现一种基于平行坐标轴动态排列的地理空间多维数据可视化分析系统,提供便捷的用户交互模式,通过2组具有明显地理空间多维属性特征的数据进行测试,验证了本文可视分析方法的有效性和实用性。结论 本文提出的可视分析方法和工具可以帮助用户快速分析地理空间多维属性存在的空间分布特征及其关联模式,为地理空间多维数据的探索提供了有效手段。  相似文献   

18.
数据挖掘是数据的深层次分析方法。将数据挖掘技术应用于学生成绩分析,可以发现学生成绩内在的特性和隐藏的状况。运用标准化数据预处理、数据聚类算法等一系列数据挖掘方法,对比传统的排序,提出了学生成绩分析的一些新思路,为发现问题、调整教学策略、有效提升成绩提供数据支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号