首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于模糊集的蚁群空间聚类方法研究   总被引:1,自引:1,他引:0       下载免费PDF全文
定义了对象间的平均距离,并将平均距离作为对象相似性的论域。通过隶属函数将对象间的相似性映射为论域上的一个模糊子集。由给定的置信水平λ,将模糊集分离为普通集,对蚂蚁是否拾起还是放下对象作出决策,实现对空间数据的聚类。并以矿山实际测量数据为空间数据源,采用基本的蚁群聚类算法和模糊蚁群空间聚类算法分别对其进行聚类。通过对这两种算法的实验结果进行分析比较,证明改进后的算法提高了聚类效果。  相似文献   

2.
遗传聚类算法往往需要较大的种群规模才能得到最优解,导致收敛速度慢,针对这一问题,本文提出一种基于自组织映射的超启发遗传聚类算法。首先利用自组织映射把数据空间转换到特征空间,再在特征空间里利用遗传算法进行搜索,然后进行反映射,即把聚类结果在数据空间里表现,从而得到一组解,同时利用K-means算法在数据空间里进行粗聚类,获得另一组解,最后比较2组解的聚类结果,相同的样本保留,不同的再次聚类,进而有效地保证了最优解的获得。计算机仿真实验验证了所提算法在种群规模较小的情况下,可以获得较高的准确率。   相似文献   

3.
改进了LF算法,提出了一种基于模糊集理论的蚁群聚类新方法。首先定义了平均距离,其次在“相似”的概念上引入模糊集理论,定义了数据对象与其邻域内对象相似程度的隶属函数,最后该数据对象的拾起或放下由隶属度与置信水平λ相比较来决定。该算法避免了LF算法中不相似的数据对象本该被拾起而可能未被拾起,相似的数据对象本该被放下而可能未被放下的弊端,并简化了LF算法。  相似文献   

4.
BK-means:骨架初始解K-means   总被引:2,自引:0,他引:2       下载免费PDF全文
K-means是典型的启发式聚类算法,容易受到初始解的影响而无法获得高质量的聚类结果。骨架是近年来启发式算法设计的研究热点,它是指所有全局最优解中相同的部分,对于提高启发式算法性能具有重要意义。给出的骨架初始解K-means算法(BK-means)的基本思想是:首先利用K-means算法得到一组局部最优解(聚类结果),通过对局部最优解求交得到骨架簇。利用骨架簇构造骨架初始解及新的搜索空间。最后以骨架初始解引导K-means算法在新的搜索空间中搜索聚类结果。在15组仿真数据集和4组实际数据集上的实验结果表明,BK-means算法具有获得高内聚、高分离的聚类结果能力。  相似文献   

5.
一种基于蚁群算法的模糊C均值聚类   总被引:22,自引:0,他引:22  
周新华  黄道 《控制工程》2005,12(2):132-134
针对模糊C均值(FCM)聚类算法,在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解,FCM算法自身并不能确定聚类个数需要人为设定,并在数据分类应用时具有了一定误差的问题,提出了一种基于蚁群算法的FCM聚类算法。该算法根据蚁群聚类算法确定模糊聚类个数和FCM算法的初始聚类中心:利用蚁群算法的全局搜索性、并行计算性等特点避免了聚类陷入局部最优解:仿真结果表明了该算法的有效性。  相似文献   

6.
移动时间层次聚类是一种势能聚类算法,具有较好的聚类效果,但该算法无法识别数据集中存在的噪声数据点。为此,提出一种抗噪的移动时间势能聚类算法。通过各个数据点的势能值以及数据点之间的相似度找到各个数据点的父节点,计算各数据点到父节点的距离,按照该距离以及数据点的势能得到λ值,并依照λ值大小构造递增曲线,通过递增曲线中的拐点来识别出噪声点,将噪声数据归到新的类簇中,对去除噪声点后的数据集,根据数据点与父节点的距离进行层次聚类来获得聚类结果。实验结果表明,该算法能够识别出数据集中的噪声数据点,从而得到更优的聚类效果。  相似文献   

7.
动态最近邻聚类算法的优化研究   总被引:4,自引:0,他引:4  
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚类算法对数据集进行聚类,并计算每次聚类结果的贝叶斯信息测度值。比较各次聚类结果的贝叶斯信息测度值,最大贝叶斯信息测度值对应的聚类即为最优聚类结果。实验结果表明,优化的最近邻聚类算法很好地解决了合适的聚类半径选取问题。  相似文献   

8.
针对核模糊C-均值(KFCM)聚类算法存在易陷入局部极小值,对初始值敏感的缺点。将混合蛙跳算法(shuffled frog leaping algorithm,SFLA)用于KFCM中,但在聚类数较大和维数较高时,聚类效果不理想,为此提出将自适应惯性权重引入混合蛙跳算法的更新策略中,再用改进后的混合蛙跳算法求得最优解作为KFCM算法的初始聚类中心,利用KFCM算法优化初始聚类中心,求得全局最优解,从而有效克服了KFCM算法的缺点。人造数据和经典数据集的实验结果表明,新算法与KFCM和FCM聚类算法相比,寻优能力更强,迭代次数更少,聚类效果更好。  相似文献   

9.
数据采集过程中普遍存在不确定性,并且在现实地理空间中,不确定数据之间可能存在障碍物间隔。为解决障碍空间中不确定数据的聚类问题,提出APPGCUO算法,该算法包括三个过程:在障碍物约束下采用R树节点最小最大值方法提出的RPT-OUCure算法,用以生成局部最优解,提高生成局部最优解的效率;继而利用近似骨架的理论提出GIABO算法,以局部最优解生成有效初始解,避免划分聚类算法中任意初始解的不足;最后结合Voronoi图的特性提出VPT-KMediods算法,减少不确定数据的积分运算量。实验结果表明,APPGCUO算法具有较高的聚类效率和质量。  相似文献   

10.
基于数据预处理的并行分层聚类算法*   总被引:3,自引:0,他引:3  
分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前基于SIMD模型的并行分层聚类算法处理海量数据时效果不理想的问题,提出一种基于数据预处理的自适应并行分层聚类算法,在O((λn)2/p)的时间内对n个输入数据点进行聚类。其中1≤p≤n/log n,0.1≤λ≤0.3。将提出的算法与现有文献结论进行的性能对比分析表明,本算法明显改进了现有文献的研究结果。  相似文献   

11.
This article presents PFCM, a parallel algorithm for fuzzy clustering of large data sets. Being a generalization of FCM, the algorithm enables arbitrary numbers of data points, features and clusters to be handled cost-optimally by hypercube SIMD computers of arbitrary cube dimension, the only limitation being the size of the local memories of the processors. Speedup responds optimally to enlarging the hypercube. PFCM owes its flexibility to the technique employed in its derivation from the sequential fuzzy C-means algorithm FCM: the association of each of the three dimensions of the problem (numbers of data points, features and clusters) with a distinct subset of hypercube dimensions.  相似文献   

12.
提出了一种基于可靠稳定的模糊核学习矢量量化(FKLVQ)聚类的Sammon非线性映射新算法。该方法通过Mercer核,将数据空间映射到高维特征空间,并在此特征空间上进行FKLVQ学习获取数据空间有效且稳定的聚类权矢量,然后在特征空间和输出空间上仅针对各空间的数据样本和它们各自的聚类权矢量进行Sammon非线性核映射。这样既降低了计算的复杂度,又使数据空间和输出空间上数据点与聚类中心间的距离信息保持相似。仿真结果验证了该方法的可靠性和稳定性。  相似文献   

13.
直径作为图的一个重要属性,旨在提出一种在数据流环境下计算不同大小的滑动窗口直径的算法机制.基本思想是:在一维上采取较容易实现的精确算法,主要体现在只保存现在组成了直径和未来可能成为直径的元素;高维时通过投影到低维的方法计算出滑动窗口直径的近似值,并且可以通过投影的个数控制近似解的精度.最后通过对实验数据的分析和解释得到了若干有益的结论,为进一步的研究工作奠定了基础.  相似文献   

14.
针对等值面生成方法从C/S到B/S的移植存在效率低、交互性差的缺点,提出一种基于ArcGIS Server的等值面快速生成方法,通过ArcGIS Server中的ModelBuilder创建模型,建立地理处理服务,以SOAP方式访问调用服务器提供的Web服务生成等值面,在客户端加以渲染。在东莞市三防决策支持子系统中的应用结果表明,该方法在效率、外观、交互性方面都较符合用户需求,可减少网络传输量并提高GIS分析性能。  相似文献   

15.
为提高金融业务数据集上的聚类质量和聚类效率,提出簇的直径、簇间的相似度这2个概念。利用距离尺度降维的中心距序降维法,将多维数据降至一维,在一维上利用自适应排序聚类算法ASC聚类。该算法和传统的Cobweb算法、K-means算法做对比,实验表明该方法能提高簇间相似度,最大提高200%。  相似文献   

16.
一种入侵检测的分类方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的入侵检测算法精度低,结果稳定性差的问题,提出了一种基于构造性核函数覆盖聚类和最大化最小概率机器回归方法的入侵检测算法。首先,利用核函数覆盖将原空间的待分类样本映射到一个高维的特征空间中,使得样本变得线性可分;然后通过控制错分率实现分类的最大化,并利用最大最小概率机的高维映射泛化特性,实现了不同核函数下的数据多维分类问题。实验结果证明,该算法具有分类准确率高、稳定性好的特点。  相似文献   

17.
提出一种基于云的多光谱遥感影像边缘检测算法。该算法依据矢量角相似性准则并结合邻域关系进行图像区域生长,在此基础之上根据影像的波段建立多维云模型,将待处理对象映射到多个云空间,通过逻辑运算生成边界云并进行多维向量的综合。构建边缘模糊特征平面,在条件概率和模糊划分熵的基础上,通过最大模糊熵原则确定最优阈值,对图像模糊边界进行提取。试验结果表明,该算法在多光谱遥感影像中能取得较好检测效果。  相似文献   

18.
为了减小模糊集及其诱导的经典阴影集之间存在的较大的不确定性差异,文中基于模糊熵提出阴影集模型——区间阴影集.由此提出基于区间阴影集的密度峰值聚类算法,优化经典密度峰值聚类算法的噪声检测策略.改进算法在原二支聚类结果的基础上摒弃原有检测策略,引入区间阴影集模型,并转化为三支聚类结果,达到噪声检测的目的.在经典人工数据集、UCI数据集上的对比实验表明,文中算法能将数据集中对象更合理地分配到相应类簇,对噪声数据具有良好的鲁棒性.  相似文献   

19.
Skyline查询能够有效地实现多目标最优化,而数据仓库中的OLAP也是针对多维数据进行分析,因此,针对Skyline查询在数据仓库中的应用,提出了数据仓库中雪花模式的Skyline-Join查询算法.该算法首先将子维表M-Join父维表,然后渐进选择式地对事实表和父维表进行连接.每次连接之前都对事实表进行分组和组内Skyline计算,删除组内非Skyline元组,这样可以减少许多不必要的连接操作,使得查询效率大大提高.通过实验证明,在事实表元组数量逐渐变大和维表个数逐渐增多的情况下,提出的算法比先Join后Skyline计算的naive算法效率上有明显改善.  相似文献   

20.
一种基于 R* -tree的时空索引   总被引:5,自引:1,他引:5  
时空数据是一种特殊的多维数据,其每一数据项的时间戳值是单调递增的。3D R-tree把时间看作为空间的另一维,然后利用R-tree进行空间索引,查询效率比较低而且只能处理离线数据。而HR-tree将时间维孤立出来,同时保存每一时间戳的空间数据,查询效率较高但是空间开销大。该文提出了一种基于R*-tree算法的时空索引方法。该方法比3D R-tree有更好的查询效率且支持在线数据模式.较之HR-tree在保证查询效率的同时使用更少的存储空间,最后给出了试验对比结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号