首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 718 毫秒
1.
在现实世界中经常遇到混合数值属性和分类属性的数据, k-prototypes是聚类该类型数据的主要算法之一。针对现有混合属性聚类算法的不足,提出一种基于分布式质心和新差异测度的改进的 k-prototypes 算法。在新算法中,首先引入分布式质心来表示簇中的分类属性的簇中心,然后结合均值和分布式质心来表示混合属性的簇中心,并提出一种新的差异测度来计算数据对象与簇中心的距离,新差异测度考虑了不同属性在聚类过程中的重要性。在三个真实数据集上的仿真实验表明,与传统的聚类算法相比,本文算法的聚类精度要优于传统的聚类算法,从而验证了本文算法的有效性。  相似文献   

2.
提出了一种改进的基于对称点距离的蚂蚁聚类算法。该算法不再采用Euclidean距离来计算类内对象的相似性,而是使用新的对称点距离来计算相似性,在处理带有对称性质的数据集时,可以有效地识别给定数据集的聚类数目和合适的划分。在该算法中,用人工蚂蚁代表数据对象,根据算法给定的聚类规则来寻找最合适的聚类划分。最后用本算法与标准的蚂蚁聚类算法分别对不同的数据集进行了聚类实验。实验结果证实了算法的有效性。  相似文献   

3.
一种基于蚁群算法的模糊C均值聚类   总被引:22,自引:0,他引:22  
周新华  黄道 《控制工程》2005,12(2):132-134
针对模糊C均值(FCM)聚类算法,在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解,FCM算法自身并不能确定聚类个数需要人为设定,并在数据分类应用时具有了一定误差的问题,提出了一种基于蚁群算法的FCM聚类算法。该算法根据蚁群聚类算法确定模糊聚类个数和FCM算法的初始聚类中心:利用蚁群算法的全局搜索性、并行计算性等特点避免了聚类陷入局部最优解:仿真结果表明了该算法的有效性。  相似文献   

4.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。  相似文献   

5.
模糊C均值聚类算法在开始时采用随机的方式选取初始聚类中心,该方式使得FCM算法对初始聚类中心的选取极为敏感,且在局部范围内较易得到最优解,但是在全局范围内的效果较差;蚁群聚类算法根据先验知识随意设定蚂蚁拾起或放下数据对象的概率,缺乏严密的数学依据。针对FCM算法和蚁群算法的不足,文中将模糊粒度计算的思想推广应用到蚁群聚类算法中,并将改进后的蚁群聚类算法与模糊C均值聚类算法相结合,提出了一种将粒度计算、蚁群算法与模糊C均值算法思想相结合的聚类算法。经过实验验证,改进后的算法较原算法具有更好的聚类效果。  相似文献   

6.
摘要:提出了一种基于信息熵的蚁群聚类算法,将信息熵引入到LF算法中,数据对象的归属由信息熵来决定,减少了参数,测试并验证了算法的有效性。同时,信息熵的蚁群算法早期数据分散收敛过慢,容易陷入局部最优等缺点,提出了一种蚁群聚类组合方法得以改进。改进思路是引入K-means作为熵蚁群算法的预处理过程。通过K-means快速、粗略地确定聚类中心,利用K-means方法的结果作为初值,再进行改进的熵蚁群算法聚类。有效地解决了蚁群算法早期收敛过慢等问题。  相似文献   

7.
针对密度峰值聚类算法存在数据集密度差异较大时,低密度区域聚类中心难以检测和参数敏感的问题,提出了一种新型密度极值算法。引入自然邻居概念寻找数据对象自然近邻,定义椭圆模型计算自然稳定状态下数据局部密度;计算数据对象余弦相似性值,用余弦相似性值来更新数据对象连通值,采用连通值划分高低密度区域和离群点;构造密度极值函数找到高低密度不同区域聚类中心点;将不同区域非聚类中心点归并到离其最近的聚类中心所在簇中。通过在合成数据集和UCI公共数据集实验分析:该算法比其他对比算法在处理密度分布差异较大数据集上取得了更好的结果。  相似文献   

8.
受不确定因素降雨难以准确处理的制约以及蚁群聚类算法在搜索空间容易陷入局部最优解和搜索速度慢的特征影响,为了提高滑坡危险性预测的精度,提出一种不确定近似骨架蚁群聚类算法。首先采用Gauss点概率模型来描述不确定数据,对不确定数据进行相似性度量;其次引入信息素重分配和自适应动态变量实现蚁群聚类算法局部信息素和全局信息素更新,提高蚁群聚类算法搜索速度,加载遗传算法避免蚁群聚类算法过早陷入局部最优;最后结合近似骨架理论,构建不确定近似骨架蚁群聚类算法模型,缩减迭代次数,快速搜索出聚类结果。在UCI真实数据集和延安宝塔区滑坡实验数据集上的实验结果显示,不确定近似骨架蚁群聚类 算法具有较高的聚类质量,预测精度达到93.3%,验证了算法在滑坡危险性预测中的可行性。  相似文献   

9.
在当今的网络中存在三种形式的数据流,连续型数据流,标称型数据流和混合属性数据流。由于目前在数据挖掘中大部分算法只能处理一种属性的数据流,而处理混合属性数据流的算法却很少,但在数据挖掘的实际应用中常常需要将不同属性的数据流进行相互区分。事实上研究人员在区分不同属性数据流时,首先是将不同属性的流进行聚类,其次是对不同属性的流进行识别。在查阅有了有关资料和参考文献后,本文提出了一种对混合属性数据流的聚类算法,该算法的聚类思想是:①提取混合属性数据流的分类属性,②使用k-近邻算法计算数据流分类属性的相似性,③根据k-近邻算法对数据流相似度的计算结果,使用k-均值聚类算法对混合属性数据流进行聚类,④给出聚类的算法。  相似文献   

10.
在传统K-中心点聚类算法中,相似性一般仅仅用距离来进行度量,这种度量方法均基于对象属性之间是独立同分布的,但大多数真实数据对象属性之间都相关联的,因此,本文将引用非独立同分布计算公式,对传统距离计算相似度方法进行替换。同时,由于此公式会依据属性值的频率来进行计算,但数值型数据对于频率并不敏感,因此,本文在引入公式之前,将数值型数据按属性列进行聚类与替换。实验结果表明,本文方法可以提高算法的聚类精度。  相似文献   

11.
蚁群聚类算法中确定相邻对象方法的改进   总被引:1,自引:1,他引:0       下载免费PDF全文
基本蚁群聚类算法在计算相似度时,由于没有考虑相邻对象之间方向的影响,往往造成聚类速度缓慢甚至算法不收敛。通过引入相邻对象方向角和屏蔽角,对方向接近的相邻对象进行屏蔽,实现对确定相邻对象方法的改进。并以矿山实际测量数据为数据源,采用基本的蚁群聚类算法和改进后的算法分别对其进行聚类。通过对这两种算法的实验结果进行分析比较,证明改进后的算法提高了聚类效果。  相似文献   

12.
传统的蚁群聚类算法将聚类数据的每一维属性都等同看待,而在实际的应用中各维属性对聚类的贡献率不一,具有主次之分,若将所有属性赋予相同的权重,将对聚类的效果造成影响.为了克服这个缺陷,本文将主成份分析(PCA)方法引入到蚁群聚类当中,利用PCA计算属性的贡献率并以此构建属性的权重.在此基础上,结合一个新的初始化策略,提出了一种属性带权的改进蚁群聚类算法.通过对多个UCI数据集的测试,验证了本算法的有效性.实验结果表明,合理的权重分配能够有效的提高蚁群聚类的质量.  相似文献   

13.
首先使用混合属性数据集表示民族突发事件中的数值信息和类属信息;然后,考虑到每个属性拥有不同权重因子,改进了蚁群聚类算法中相似度密度的计算方法;在此基础上,给出了一种混合属性数据集蚁群聚类算法。聚类分析结果表明,应用该算法能得出民族突发事件的发生规律,因此该算法可用于民族突发事件的应急智能辅助决策。该算法是应急预案自动生成等工作的基础,明确给出了未来工作的内容、方法和步骤,为维护国家安全提供了智能化支持。  相似文献   

14.
This paper presents a multi-ant colonies approach for clustering data that consists of some parallel and independent ant colonies and a queen ant agent. Each ant colony process takes different types of ants moving speed and different versions of the probability conversion function to generate various clustering results with an ant-based clustering algorithm. These results are sent to the queen ant agent and combined by a hypergraph model to calculate a new similarity matrix. The new similarity matrix is returned back to each ant colony process to re-cluster the data using the new information. Experimental evaluation shows that the average performance of the aggregated multi-ant colonies algorithms outperforms that of the single ant-based clustering algorithm and the popular K-means algorithm. The result also shows that the lowest outliers strategy for selecting the current data set has the best performance quality.  相似文献   

15.
提出了一种基于方向相似性度量的蚁群聚类算法。首先针对方向性数据的特点将方向性度量引入蚁群聚类算法作为相似性度量;其次使用两个反应阈值决定人工蚂蚁的聚类动作,避免了LF算法中由于计算平均相似度而出现的不足。实验结果表明,该算法能有效地对方向性数据聚类,具有一定的实际应用价值。  相似文献   

16.
为了解决分拣搬运机器人在路径规划过程中,遇到目标点众多的情况时存在路径寻优效率低、容易出错等问题。针对A*算法存在多个最小值时,无法实现路径最优化的问题进行研究,提出一种将蚁群算法与A*算法相结合的改进A*算法。首先使用A*算法筛选出一条最优化的路线来分布信息素,从而简化A*算法在路径规划上的运算。其次以筛选出的路线为基础,针对不同情况结合蚁群算法设计了三种通用方案,以此为基础进行具体的路径规划,从而解决A*算法本身存在的容易带入大量重复数据的问题。通过仿真与实际实验验证了本文提出的改进的A*算法能够满足自动分拣搬运的需求,值得推广与使用。  相似文献   

17.
熊伟超  蒋瑜 《计算机应用研究》2023,40(10):3053-3058
针对LF蚁群聚类算法没有区分数据集属性重要度、算法效率低和聚类效果不稳定的问题,提出一种基于熵权的全局记忆LF算法(weighted global ant colony optimization, WGACO)。该算法首先通过熵权法计算各属性熵权,修改欧氏距离计算公式,以提升聚类精度;使用权重最大的属性值对数据对象进行初始化,增强聚类效果的稳定性;引入全局记忆矩阵减少蚂蚁的无效移动,提升算法效率;加入算法的收敛条件,提升算法实用性。选取UCI数据库中的7个真实数据集和3个人工生成的数据集进行数值实验,并与GMACO、SMACC、ILFACC三种改进LF的算法进行比较,实验结果表明,所提算法在精度、算法效率和稳定性上都有比较好的提升,在处理高维数据上也有较好的表现。最后,WGACO在商场会员用户细分上表现良好,体现了其实用价值。  相似文献   

18.
针对基于VSM(vector space model)的文本聚类算法忽略了词之间的语义信息和各维度之间的关系,导致文本的相似度计算不够精确,提出了一种基于语义相似度的群智能文本聚类的新方法。该方法融合了模拟退火算法的全局搜索和蚁群算法的正反馈能力。其思路是,首先从语义上分析文本,利用K-均值算法进行文本聚类,再根据K-均值算法的结果,使用蚁群和模拟退火算法进行调整聚类。测试结果表明这种算法能够提高聚类精度和召回率,也验证了混合算法的正确性。  相似文献   

19.
直觉模糊K-modes(IFKM)算法在聚类过程中采用简单0-1匹配相似性度量,既无法有效刻画类内数据对象之间的相似性,也未体现不同属性在聚类过程中的贡献程度;此外,IFKM算法在聚类的每一次迭代中直接根据直觉模糊隶属度矩阵来确定数据对象所属类别,没有充分发挥直觉模糊思想的作用.为了解决这两个问题,提出一种迭代IFKM...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号