首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
聚类是最常用的数据挖掘算法之一.为了提高聚类结果的质量,应用拉格朗日乘数法提出了一种基于属性权重最优化的k-means聚类算法.该算法在计算样本与质心的距离时为各属性赋予相应的权重以表示属性的重要程度,并在每轮迭代中根据质心向量的变化自动计算最优的属性权重,使得所有样本与相应质心的距离和最小.实验结果验证了该方法相对于传统k-means算法的优势.  相似文献   

2.
针对电力系统当前输出数据多、数据应用能力差等问题,提出一种新型的数据挖掘方法。构建改进型数据挖掘聚类算法模型,通过FCM聚类算法模型实现电力系统应用过程中不同状态数据分析、计算与应用;构建回归算法模型,实现分类后数据信息的预测;通过构建电力系统应用模型,将不同的数据信息融合后,实现了多种数据信息的挖掘与应用。实验证明,该研究方法分类能力强、预测精度高,可推广使用。  相似文献   

3.
提出了一种改进蚁群文本聚类算法.改进蚁群文本聚类算法利用信息素对蚂蚁随机移动进行控制,使蚂蚁朝着文本向量相对集中的区域移动,缩短蚂蚁寻找文本向量簇的时间,提高聚类效率.采用复旦大学中文文本分类语料库进行仿真实验,实验结果表明,改进蚁群文本聚类算法不仅加快了文本聚类算法的收敛速度,而且提高文本聚类结果的精度.  相似文献   

4.
聚类算法及聚类融合算法研究   总被引:1,自引:0,他引:1  
基于常用聚类算法及聚类融合算法进行了研究。首先阐述了数据挖掘领域的常用聚类算法及特点,接下来对近年来聚类融合的方法和研究现状进行了综述,并对如何产生高效的聚类成员和共识函数如何构建才能产生高效的聚类融合算法进行了说明。运用改进的随机投影算法来生成聚类成员,实验表明随机投影是一个生成聚类成员的很有效的方法。最后得出运用聚...  相似文献   

5.
彭艳  王小玲 《信息技术》2008,32(1):89-90,94
利用一种混合聚类算法对用户聚类方法进行分析.给出了此混合聚类算法的应用公式以及在用户聚类算法中应用的思路,最后给出了该算法的具体实现过程.  相似文献   

6.
采用信息化技术实现高校教学质量考评是提高工作效率、促进教学改革的重要手段和发展趋势。本文主要是提出一种基于聚类算法的教学质量考评方法,提高教学质量评价结果的准确性,为教学改革提供更好的数据参考。  相似文献   

7.
聚类算法在图像分割领域有广泛的应用,本文通过对四种聚类算法的介绍与分析,深入了解其算法原理,以及其在图像分割领域中的应用效果,通过四种的算法的比较,总结出了各个算法的优缺点。  相似文献   

8.
《现代电子技术》2017,(21):112-116
模糊C均值聚类算法在处理高维数据集时,存在计算复杂度高,算法泛化能力差,计算精度低等问题。考虑到特征属性对聚类的贡献程度的差异,在多属性模糊C均值聚类的思想上,提出一种基于属性重要性的约简算法。为验证有效性,在UCI数据集上,将新算法与因子分析法和粗糙集理论约简方法进行比较分析。实验结果表明,该方法具有更好的泛用性,在平均标准差大或类间中心距离较远的数据集上具有更好的性能。  相似文献   

9.
聚类算法是数据挖掘的核心技术,根据评价聚类算法优劣的几个标准,对数据挖掘中常用聚类算法做了比较分析,根据各自特点,加以改进,并应用于武警部队数据挖掘项目中。通过运用改进型K-means算法,取得了较好的挖掘结果,为进一步信息的智能化检索、信息的过滤、分拣提供依据。  相似文献   

10.
本文通过集成多次FCM(Fuzzy C-Means)聚类结果以及采用软化分方式,提出一种新的自动确定聚类个数的模糊聚类算法.本算法首先利用不同的聚类数目对数据进行FCM聚类,然后充分利用多次FCM聚类得到的隶属度信息构建一个累积邻接矩阵,最后采用迭代方式对累积邻接矩阵进行图切分以获取最终聚类结果.大量的仿真实验表明,相对现有集成聚类方法,本文方法能够有效减少FCM的聚类次数,并且在图切分过程中的迭代次数为现有方法的1/2左右.  相似文献   

11.
针对整个复杂CLASS全属性聚类的聚类算法在聚类算法中有较为复杂的实现要求,试图对社交软件中较为复杂的CLASS-USER进行整体聚类计算,难度在于将其复杂属性体系整合成高维度变量进行降维处理。通过多次连续的数据整理,特别使用了二维模糊矩阵与排序算法实现快速降维,将高达13维的高维度变量进行降维处理,最终形成一维变量,最后使用常见的K-means聚类算法对该一维变量进行聚类分析。  相似文献   

12.
本文从网络流量的数据来源出发,浅谈了聚类算法处理网络流量的基本流程。  相似文献   

13.
岩石的孔隙、喉道等特征是地质人员进行判断储层特征的重要参数.因岩石图像具有较高的复杂度,图像纹理相似,因而对岩石图像进行分析时有一定的难度.人工进行分析时,容易因为各种原因出现误差.本文提出利用模糊C均值算法(FCM)对鄂尔多斯盆地岩石铸体薄片进行聚类分析,实验结果能很好的将岩石铸体薄片中孔隙与岩石背景区分出来,为后期的岩石自动识别与分类奠定了基础.FCM是基于划分的一种非监督聚类算法.  相似文献   

14.
桑国珍 《现代电子技术》2009,32(20):155-156
蚁群算法是优化领域中一种新兴的生物进化算法,与传统的算法相比,其具有并行、正反馈和启发式搜索等特点.在此,运用蚁群聚类算法对客户关系管理中的客户分类问题进行分析.结果表明,通过此算法对企业的客户消费数据进行分类,以此来获取不同类型客户的需求,对支持企业决策方面有着极为重要的理论参考价值和实际应用意义.  相似文献   

15.
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。  相似文献   

16.
本文主要研究海平面聚类算法,通过与AP算法以及MD算法的比较和结合,采用适当的密度函数解决边缘点和归类丢失点的问题,有效地改进了其算法的功能和聚类效果.  相似文献   

17.
在数据挖掘的所有算法中,聚类分析尤为重要.基于划分的聚类算法就是用统计分析的方法研究分类问题.本文介绍了聚类的定义及聚类算法的种类,详细阐述了K均值聚类算法和K中心点聚类算法的基本原理并对它们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行了梳理,对其具体应用实例做了简要介绍。  相似文献   

18.
江楠  徐秦 《电子科技》2015,28(1):155-157
基于监测数据进行分析,采用特殊投影和拟合的数据流聚类算法,该算法结合拟用算法和滑动窗口技术进行聚类预处理,掌握数据流的变化趋势。此外,通过桥梁健康监测仿真实验,得出拟合数据具有更高的精确性,分段拟合的数据R2接近1,m为0.890 4<0.5,解决了高维数据流的降维问题,缩短了数据处理时间,且提高效率39.1以上,占用空间仅为6.7%。  相似文献   

19.
《现代电子技术》2019,(7):177-180
为研究聚类算法在高校学生微博的应用情况,针对K-means算法和分层聚类算法在聚类中心选择不精确的问题,基于高校学生使用微博的背景,对微博文本挖掘应用中聚类算法的应用进行改进。通过文本的矢量表示、文本相似度计算和聚类算法的实现,验证了聚类算法在微博热门话题检测的准确性和效率,并针对实验数据提出几点针对性的措施。  相似文献   

20.
属性图各节点附有的节点属性标签,为节点提供了更加丰富的信息,在数据挖掘应用,特别是数据聚类问题中如何有效利用这些丰富的信息,已经成为开展此类研究的研究目的。不同于传统图聚类,属性图上的聚类要同时考虑图的结构信息和节点的属性信息,因此如何平衡两者之间的关系,这是属性图聚类主要关注所在。目前已提出的属性图聚类算法,部分算法的效率很高,然而聚类质量较差,同时一些算法可以得到较好的聚类结构,然而算法消耗大量的系统资源,效率也较低。这些算法均没有考虑簇之间存在重叠的情况,这导致无法得到更高精度的聚类结构。因而提出一种属性图上的重叠聚类挖掘算法,实验表明,提出的算法可以得到更高的聚类精度,特别是可以提升聚类内部节点的属性相似度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号