首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
由于对聚类网格之间的相互影响未作出考虑,导致数据聚类算法出现聚类质量差等情况。因此,提出一种基于网格耦合的混合属性大数据聚类算法。通过网格耦合定义相关参量的基础,得到网格耦合过程中网格质心间距,利用网格进行大数据聚类,充分分析各个网格间权重影响情况。该聚类算法分别从在线和离线两个阶段开展:在线阶段更新网格特征向量,并根据属性动态变化划分网格;离线阶段构建无向图,顶点设置为网络中心点,质心距离以及中心点间距作为边构建无相图,根据该图获得最小生成树同时切断该树第r-1最大边,最终获取混合属性大数据的k个聚类,实现混合属性的准确聚类。实验结果表明,该算法在质心调节参数与质心距离取值较适中情况下具有良好聚类效果,且聚类质量与聚类效率较高。  相似文献   

2.
为了解决传统归一化割(Normalized cut,Ncut)算法需要人工干预因素过多,限制了算法的通用性,本文对传统Ncut算法进行了改进,提出了自适应的图像分割方法。首先采用基团势的理论替代了传统的Ncut算法中计算权值矩阵时两个控制参数对结果的影响;然后为了减少K-means算法对分类数目和类中心的敏感,本文采用基于最小生成树的聚类方法对Ncut计算出的特征向量进行分类,得到最终的分类数目和初始类中心,然后再采用K-means算法进行聚类得到最终的分割结果。实验结果显示,本文的算法不仅提高了算法的通用性,并且分割效果比较好。  相似文献   

3.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

4.
最小生成树SVM的模拟电路故障诊断方法   总被引:1,自引:0,他引:1  
提出最小生成树的支持向量机模拟电路故障诊断方法,通过小波分解提取电路故障特征,在特征空间中以故障类的可分性测度为权值构造最小生成树,得到具有聚类属性的故障子类划分,从而优化故障决策树节点的分布。按照最小生成树的结构建立具有较大分类间隔的多分类支持向量机,能够有效地提高模拟电路故障诊断的正确率。该方法简化支持向量机的结构,在实例电路的故障诊断中获得更高的诊断精度和效率,其性能优于常用的支持向量机方法。  相似文献   

5.
基于二值属性的聚类分析算法   总被引:2,自引:0,他引:2  
解决分析型CRM系统中客户类别划分问题,聚类分析是必不可少的算法,根据分析对象所涉及的数据类型、聚类目的以及具体应用要求选择恰当的聚类算法是解决问题的关键.针对客户关系管理中依据客户购买力划分客户类别的问题,结合相关营销理论、数据类型及属性表示方法,提出使用二值属性描述对象、采用最短距离法进行聚类的算法,并通过该方法进行了实例计算.计算结果表明,用二值属性表示对象的方法不仅简洁、方便、易懂,而且对聚类结果具有直观的检验性.  相似文献   

6.
通过分析传统K-means算法难以确定聚类中心数目的问题,提出了一种改进的K-means聚类算法(CS-kmeans).该算法分析当聚类效果较好时最大类内距离与最小类间距离之间的关系,使用类内距离小于最小类间距离以及类间距离大于最大类内距离实现对类别数的自动分割与合并,从而确定适当的聚类数目.实验结果表示,文中改进后的算法相比传统K-means算法和其他改进算法,对于确定聚类中心数目、提高聚类质量是更为有效的.  相似文献   

7.
总体布线在超大规模集成电路的设计中有着举足轻重的作用.为了寻求总体布线图的最优斯坦纳树,改进了普里姆(Prim)算法,提出了一种基于改进的普里姆启发式算法寻求最小矩形斯坦纳树(RST)的方法,不同于以往的先求最小生成树(MST)然后再把树的边矩形化的方法;同时考虑到时延在深亚微米、超深亚微米阶段的重要影响,在算法中又加入了总体布线设计时的时延要求,最后通过仿真实例验证了算法的可行性.  相似文献   

8.
为了解决Dijkstra(DK)算法对大规模数据构造最小树时效率不高的问题,结合局部敏感哈希映射(LSH),针对欧氏空间中的样本,提出了一种近似最小树的快速生成算法,即LSHDK算法.该算法通过减少查找近邻点的计算量提高运行速度.计算实验结果表明,当数据规模大于50 000个点时,LSHDK算法比DK算法速度更快且所计算的近似最小树在维数较低时误差非常小(0.00~0.05%),在维数较高时误差通常为0.1%~3.0%.  相似文献   

9.
现有数据流聚类算法多数面向的是确定性数据,可是不确定数据的数据流聚类逐步被受到关注,因为经典的不确定数据聚类算法具有概率密度函数获取困难、实用性不强以及计算复杂等缺点,提出一种基于区间数的不确定数据流聚类算法UIDStream.算法用区间数来表示属性不确定性数据和基于区间数的距离计算方法,定义了不确定性数据之间的相似度,并利用传统k近邻聚类的思想,提出基于区间数的2k近邻微簇和最优2k近邻微簇的概念,通过最优2k近邻微簇的融合,实现不确定数据流的聚类.实验结果表明:改进后的算法具有良好的聚类效果,提高了不确定数据流聚类的聚类质量和速率.  相似文献   

10.
针对智能教学系统中个性化教学序列生成规则难于获取的问题,提出了将案例推理技术应用于教学序列生成,设计了学生案例相似度的计算方法.为了在案例数量增大时获得较好的检索速度和命中率,提出通过关键属性聚类来对案例进行划分并设计了用于聚类的惰性2-中心点算法,最后以实例验证了系统设计的可用性.  相似文献   

11.
针对目前的最小生成树算法只能求一个最小生成树问题,提出一种新的最小生成树算法。该算法主要采用二进制编码的方式,并结合最小生成树的特点,通过先判断图的边数淘汰一些非生成树,然后通过判断连通性再淘汰一些非生成树,最后从所有的生成树中找到所有最小生成树。由于算法的本质就是在全局范围内寻找最优,故该算法可以找到一个连通图的所有最小生成树。算例表明,该算法具有步骤清晰、方便程序实现、通用性好的特点。  相似文献   

12.
基于改进Prim算法的变电站巡检机器人路径规划   总被引:1,自引:0,他引:1  
变电站巡检机器人主要代替人进行变电站设备巡检,全面实现变电站无人值守。通过GPS定位技术获取机器人及设备位置信息,并将其抽象成网状存储结构,利用改进Prim算法生成最小生成树,同时,设计遍历算法遍历最小生成树,使路径回溯花费最小,完成机器人巡检路径规划。仿真实验结果表明,算法具有数据结构简单、执行效率高的特点。  相似文献   

13.
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边,对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确地分析出数据中存在的合理聚类和例外样本.  相似文献   

14.
开沟布线问题定义为由最短路径树和最小生成树这两个问题组合而成的组合优化问题,是一个新提出的、易于描述的却难于处理的NP完全问题.该文将图论、组合优化以及CNRP等技术相结合来对开沟布线问题进行了探索和研究,在指定一些约束的基础上建立的的数学模型较准确的描述了开沟布线问题的实质.给出了求解该问题的最直观简单的方法SP-MST求解法.并引入邻域搜索策略,在CTPHERUR1算法的基础上,提出了基于2-交换邻域搜索的改进算法,实验表明,该算法得到的近似解更接近最优解.  相似文献   

15.
一种WSN中的能耗优化动态路由算法   总被引:1,自引:0,他引:1  
根据无线传感器网络中因节点有效传输半径对路由选择的制约,提出基于最小生成树(MST)的改进分簇多跳路由算法,改善因路由选择对网络能耗的影响.该算法利用Voronoi图的泊松过程特性优化簇首节点数,并结合MST动态调整簇内外节点的路由发现实现网络能耗优化.仿真结果表明,该算法在开销容忍的前提下,网络负载均衡,并与相同仿真条件下基于LEACH的分层多跳算法相比,更有效地延长了网络寿命,且降低了计算复杂度.  相似文献   

16.
为了保证重建的模型质量或模型配准的精度,提出采用基于最小生成树的聚类算法将点云数据中的噪点去除,并在尸体股骨上对这种骨表面点云数据的获取方法的可行性和噪点去除方法的有效性进行了验证。实验证明,这种数据获取方法是可行的,所采用的噪点去除方法也是有效的。  相似文献   

17.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。  相似文献   

18.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

19.
基于遗传算法的最小生成树算法   总被引:7,自引:0,他引:7  
以图论和遗传算法为基础 ,提出了一种求最小生成树的改进遗传算法 .该算法采用二进制编码表示最小树问题 ,用深度优先搜索算法进行图的连通性判断 ,并设计出相应的适应度函数、单亲换位算子和单亲逆转算子以及四种控制性进化策略 ,以提高算法执行速度和进化效率 .与Kruskal算法相比 ,该算法能在一次遗传进化过程中获得一批最小生成树 ,适合于解决不同类型的最小树问题  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号