首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
针对滑坡危险性预测中降雨等不确定因素不能有效刻画及处理和现有的OPTICS-PLUS聚类算法需要设置密度阈值、时间复杂度高等问题进行了研究,为了提高滑坡危险性预测准确率,提出一种不确定NNSB-OPTICS聚类算法并应用于滑坡预测中。首先对OPTICS-PLUS算法扩张策略进行优化,避免了人工设置密度阈值,提高了算法效率;然后根据降雨量数据的分布特征,综合EW型距离公式和云模型理论,提出EC型距离公式,有效处理不确定数据降雨量;最后将不确定NNSB-OPTICS聚类算法应用于延安市宝塔区滑坡危险性预测中,建立滑坡危险性预测模型,滑坡预测精度达到89.7%。实验结果表明,该方法能够有效提高滑坡危险性预测精度,具有较高可行性。  相似文献   

2.
针对滑坡危险性预测中降雨等不确定诱发因素难以有效处理,CFSFDP算法需要人工尝试设置密度阈值以及对大规模数据集无法进行准确聚类等问题,为了提高滑坡危险性预测准确度,提出一种基于网格与类合并的不确定CFSFDP (简称不确定GM-CFSFDP)聚类算法.该算法首先引入不确定数据处理方法,设计了E-ML距离公式,有效刻画降雨不确定因素;其次通过网格划分的思想把大规模数据集划分到多个网格空间中,实现大规模数据有效编码;计算网格平均密度,建立网格密度阈值分布模型,动态获得网格密度阈值;最后利用层次聚类思想对关联性较高的类进行合并,构建不确定GM-CFSFDP算法模型,在延安宝塔区进行滑坡实例验证.实验结果表明不确定GM-CFSFDP聚类算法获得较高的预测精度,从而验证了该算法在滑坡危险性预测中的可行性和先进性.  相似文献   

3.
受不确定因素降雨难以准确处理的制约以及蚁群聚类算法在搜索空间容易陷入局部最优解和搜索速度慢的特征影响,为了提高滑坡危险性预测的精度,提出一种不确定近似骨架蚁群聚类算法。首先采用Gauss点概率模型来描述不确定数据,对不确定数据进行相似性度量;其次引入信息素重分配和自适应动态变量实现蚁群聚类算法局部信息素和全局信息素更新,提高蚁群聚类算法搜索速度,加载遗传算法避免蚁群聚类算法过早陷入局部最优;最后结合近似骨架理论,构建不确定近似骨架蚁群聚类算法模型,缩减迭代次数,快速搜索出聚类结果。在UCI真实数据集和延安宝塔区滑坡实验数据集上的实验结果显示,不确定近似骨架蚁群聚类 算法具有较高的聚类质量,预测精度达到93.3%,验证了算法在滑坡危险性预测中的可行性。  相似文献   

4.
在不确定数据流聚类算法的研究中,位置不确定性是一种新的不确定数据类型.已有的不确定数据模型不能很好地描述和处理位置不确定数据.鉴于此,在提出基于联系数的位置不确定数据模型、联系距离函数、微簇密度可达性等主要概念的基础上,提出了一种联系数表达的位置不确定数据流聚类算法--UCNStream.数据流聚类算法采用在线/离线两级处理框架,使用基于密度峰值思想的初始化策略,定义了新的可动态维护的微簇聚类特征向量.利用衰减函数和微簇删除机制对微簇进行在线维护,准确地反映了数据流的演化过程.最后,分析了算法的计算复杂性,并通过对实际数据集上的实验与几种优秀的聚类算法进行了比较,实验结果表明,UCNStream算法具有较高的聚类精度和处理效率.  相似文献   

5.
针对传统的划分聚类算法不能够发现任意形状的簇的缺点,本文引入一种能够有效反映样本间相似度的距离度量---基于路径的距离度量,并设计了新的目标准则函数,从而进一步提高算法的有效性。实验表明本文的算法能够自动确定聚类的个数,可以发现任意形状的类,对孤立点不敏感,而且具有高质量的聚类效果。  相似文献   

6.
新的K-均值算法最佳聚类数确定方法   总被引:8,自引:0,他引:8       下载免费PDF全文
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。  相似文献   

7.
针对传统模糊C-均值聚类算法(FCM算法)初始聚类中心选择的随机性和距离向量公式应用的局限性,提出一种基于密度和马氏距离优化的模糊C-均值聚类算法(Fuzzy C-Means Based on Mahalanobis and Density,FCMBMD算法)。该算法通过计算样本点的密度来确定初始聚类中心,避免了初始聚类中心随机选取而产生的聚类结果的不稳定;采用马氏距离计算样本集的相似度,以满足不同度量单位数据的要求。实验结果表明,FCMBMD算法在聚类中心、收敛速度、迭代次数以及准确率等方面具有良好的效果。  相似文献   

8.
提出一种不确定域环境下基于DKC值改进的K-means聚类算法,即U2d-Kmeans。该算法首先考虑到数据对象的不确定性因素,引入不确定域对数据对象进行描述;其次吸取2d-Kmeans的优点,对数据集进行预处理(剔除孤立点),并且采用累积距离的方法确定初始聚类中心,从而避免了随机选取聚类初始点造成聚类不稳定的缺陷;最后经过算法有效性对比实验证明得出,U2d-Kmeans算法比前两种算法更客观、有效。  相似文献   

9.
一种基于近邻传播算法的最佳聚类数确定方法   总被引:2,自引:0,他引:2  
在聚类分析中,决定聚类质量的关键是确定最佳聚类数,对此,从样本几何结构的角度定义了样本聚类距离和样本聚类离差距离,设计了一种新的聚类有效性指标.在此基础上,提出一种基于近邻传播算法确定样本最佳聚类数的方法.理论研究和实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合于确定样本的最佳聚类数.  相似文献   

10.
基于粗糙集的混合属性数据聚类算法   总被引:2,自引:0,他引:2  
范黎林  王娟 《计算机应用》2010,30(12):3377-3379
传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。  相似文献   

11.
为了解决传统的贝叶斯分类技术在构建滑坡危险性分类和预测的模型的过程中难以有效地获取预测模型所需的参数及滑坡诱发因素定量刻画技术难题等问题,引入不确定贝叶斯算法,将不确定数据的可能世界模型与朴素贝叶斯分类模型结合起来,构建了不确定贝叶斯分类模型,从而有效刻画降雨量这一属性级不确定的属性,达到提高滑坡危险性预测精度的目的。通过实例验证了运用该方法进行滑坡危险评价的可行性和高效性。  相似文献   

12.
何童 《计算机工程》2012,38(11):56-58
在传统CLARANS聚类算法基础上,提出一种针对不确定性目标的CLARANS聚类算法。在该算法中,待聚类的每个不确定性目标都被表示成高斯混合模型,即高斯分布的一个加权和,并将Kullback-Leibler散度作为不确定性目标间的距离测度。在图片数据库上的实验结果表明,该算法具有较高的聚类精度。  相似文献   

13.
在不确定性数据聚类算法的研究中,普遍需要假设不确定性数据服从某种分布,继而获得表示不确定性数据的概率密度函数或概率分布函数,然而这种假设很难保证与实际应用系统中的不确定性数据分布一致。现有的基于密度的算法对初始参数敏感,在对密度不均匀的不确定性数据聚类时,无法发现任意密度的类簇。鉴于这些不足,提出基于区间数的不确定性数据对象排序识别聚类结构算法(UD-OPTICS)。该算法利用区间数理论,结合不确定性数据的相关统计信息来更加合理地表示不确定性数据,提出了低计算复杂度的区间核心距离与区间可达距离的概念与计算方法,将其用于度量不确定性数据间的相似度,拓展类簇与对象排序识别聚类结构。该算法可很好地发现任意密度的类簇。实验结果表明,UD-OPTICS算法具有较高的聚类精度和较低的复杂度。  相似文献   

14.
基于混合聚类算法的模糊函数系统辨识方法   总被引:1,自引:0,他引:1  
针对传统模糊系统存在的结构难以确定和参数辨识复杂的问题,提出了一种基于混合聚类算法的模糊函数系统辨识算法.与一般的模糊函数系统相比,混合聚类算法结合模糊C均值和模糊C回归模型聚类算法的样本距离.在模型预测部分,采用高斯函数计算每个输入变量的隶属度,利用输入变量隶属度的模糊化算子得到输入向量的隶属度.应用于Box-Jenkins煤气炉数据、一个双入单出的非线性系统和Mackey-Glass混沌时间序列数据的试验结果表明,本文算法具有很好的辨识效果,从而验证了本文算法的有效性与实用性.  相似文献   

15.
针对谱聚类融合模糊C-means(FCM)聚类的蛋白质相互作用(PPI)网络功能模块挖掘方法准确率不高、执行效率较低和易受假阳性影响的问题,提出一种基于模糊谱聚类的不确定PPI网络功能模块挖掘(FSC-FM)方法。首先,构建一个不确定PPI网络模型,使用边聚集系数给每一条蛋白质交互作用赋予一个存在概率测度,克服假阳性对实验结果的影响;第二,利用基于边聚集系数流行距离(FEC)策略改进谱聚类中的相似度计算,解决谱聚类算法对尺度参数敏感的问题,进而利用谱聚类算法对不确定PPI网络数据进行预处理,降低数据的维数,提高聚类的准确率;第三,设计基于密度的概率中心选取策略(DPCS)解决模糊C-means算法对初始聚类中心和聚类数目敏感的问题,并对预处理后的PPI数据进行FCM聚类,提高聚类的执行效率以及灵敏度;最后,采用改进的边期望稠密度(EED)对挖掘出的蛋白质功能模块进行过滤。在酵母菌DIP数据集上运行各个算法可知,FSC-FM与基于不确定图模型的检测蛋白质复合物(DCU)算法相比,F-measure值提高了27.92%,执行效率提高了27.92%;与在动态蛋白质相互作用网络中识别复合物的方法(CDUN)、演化算法(EA)、医学基因或蛋白质预测算法(MGPPA)相比也有更高的F-measure值和执行效率。实验结果表明,在不确定PPI网络中,FSC-FM适合用于功能模块的挖掘。  相似文献   

16.
针对软子空间聚类过程中簇间距离(簇间的分离程度)对聚类的影响程度不确定的问题,提出了一种基于簇内紧密度和簇间距离自适应软子空间聚类算法。算法以经典的k均值聚类算法框架为基础,在最小化各个子空间簇类的簇内紧密度的同时最大化各个子空间簇类的簇间距离。并且通过推导得到新的子空间聚类中心和特征加权的计算方式,克服了软子空间聚类对输入参数敏感的缺点,实现了算法的自适应学习,并且取得了较好的聚类效果。  相似文献   

17.
万静  郑龙君  何云斌  李松 《计算机应用》2019,39(11):3280-3287
如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维度不确定数据,并分别处理以提高算法效率。采用结合期望距离的K近邻(KNN)查询得到对聚类结果影响最小的不确定数据近似值以提高聚类精度。在得到确定数据之后,采用子空间聚类的方式避免维度灾难的影响。实验结果证明,基于Clique的高维不确定数据聚类算法(UClique)在UCI数据集上有较好的表现,有良好的抗噪声能力和伸缩性,在高维数据上能得到较好的聚类结果,在不同的不确定数据集实验中能够得到较高精度的实验结果,体现出算法具有一定的健壮性,能够有效地对高维不确定数据集聚类。  相似文献   

18.
魏方圆  黄德才 《计算机科学》2017,44(Z11):442-447
不确定性数据聚类方法的研究日益受到广泛关注,其中UIDK-means算法与U-PAM算法继承了基于划分算法无法识别任意形状簇和对噪声点敏感的缺陷。FDBSCAN算法事先假定不确定性数据的概率分布函数或概率密度函数是已知的,然而这些信息在实际应用中往往难以获取。针对上述算法的不足,提出一种基于区间数的多维不确定性数据聚类UID-DBSCAN算法。该算法利用区间数结合数据的统计信息合理地表示不确定性数据,采用低计算复杂度的区间数距离函数衡量不确定性数据对象间的相似度,首次提出区间数的密度、密度可达与密度相连等概念,并将其用于扩展簇中,同时结合数据集的统计特征自适应地选取算法的密度参数来实现自动聚类。实验结果表明,UID-DBSCAN算法能够有效识别噪声,处理任意形状簇,具有较高的聚类精度和较低的计算复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号