首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
对分别采用欧氏距离和网络距离作为相似性测度的聚类方法进行分析,并从空间网络中对象间着手,提出一种具有方向特点的网络对象聚类算法.算法利用空间网络的邻接关系,将两种距离结合起来作为聚类的相似性测度以提高聚类的精度.算法分析和实验证明,该算法的聚类效果优于单一度量的聚类方法.  相似文献   

2.
基于模糊c-means算法的空间数据分类和预测   总被引:2,自引:0,他引:2  
空间分类和预测是空间数据挖掘中一个非常重要的方法,但对它们的研究目前尚处于初始阶段.通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊c-means算法的空间数据分类和预测的方法(SFCM),该方法首先用模糊c-means方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊c-means算法进行空间聚类时加入了空间信息,然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类,最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值,理论分析和实验结果表明,该算法是有效可行的.  相似文献   

3.
由于当今的网络数据是海量的,因此科研人员对某些问题进行研究时需要将不同属性的数据从中提取出来,然而在提取这些数据之前需要将相同数据进行聚类。数据聚类的过程,也就是寻找数据最优属性的过程,然而人工蚁群就是一种寻找问题最优解的算法,因此在本文中再次将蚁群算法在聚类中进行应用。由本文提出的聚类算法可以分为两个部分,第一部分是:通过相似性算法来衡量数据之间的相似度,第二部分是:根据第一部分的计算结果,再采用蚁群算法为需要聚类的数据选择不同的聚类中心,从而对不同属性的数据进行聚类,经过以上两个过程的计算,可以实现对数据的聚类。在本文中进行数据聚类时采用的相似性度量来代替距离的计算,是本文创新点之一,采用蚁群算法在聚类过程中来选择聚类中心也是本文的创新所在。  相似文献   

4.
模糊C均值聚类算法在开始时采用随机的方式选取初始聚类中心,该方式使得FCM算法对初始聚类中心的选取极为敏感,且在局部范围内较易得到最优解,但是在全局范围内的效果较差;蚁群聚类算法根据先验知识随意设定蚂蚁拾起或放下数据对象的概率,缺乏严密的数学依据。针对FCM算法和蚁群算法的不足,文中将模糊粒度计算的思想推广应用到蚁群聚类算法中,并将改进后的蚁群聚类算法与模糊C均值聚类算法相结合,提出了一种将粒度计算、蚁群算法与模糊C均值算法思想相结合的聚类算法。经过实验验证,改进后的算法较原算法具有更好的聚类效果。  相似文献   

5.
郏宣耀 《计算机应用》2005,25(Z1):176-177
针对高维数据相似度难定义的问题,提出了一种基于相似性二次度量的高维聚类算法.该算法首先由属性分布相似度和空间距离计算数据对象间实距离矩阵,得到各对象的最近邻表,根据该表内元素的交叉情况计算出数据间的相似性矩阵,最后根据该相似矩阵进行数据聚类.实验结果显示该算法能够获得优秀的聚类结果.  相似文献   

6.
提出了一种基于方向相似性度量的蚁群聚类算法。首先针对方向性数据的特点将方向性度量引入蚁群聚类算法作为相似性度量;其次使用两个反应阈值决定人工蚂蚁的聚类动作,避免了LF算法中由于计算平均相似度而出现的不足。实验结果表明,该算法能有效地对方向性数据聚类,具有一定的实际应用价值。  相似文献   

7.
谱聚类是对样本拉普拉斯矩阵的特征向量进行聚类,不局限于原始数据的分布形状,可收敛于全局最优解,但不能准确反映样本间的实际关系,而模糊核聚类可利用模糊数学理论确定样本间的模糊关系。为此,在调整相似度度量函数和距离度量函数的基础上,将模糊核聚类融合到谱聚类算法中,提出SC-KFCM算法,利用模糊划分改进谱聚类中的硬划分,根据特征向量间的相似性和关联程度建立模糊隶属关系并对样本进行聚类,从而弥补谱聚类中硬划分部分对聚类结果造成的影响。实验结果表明,SC-KFCM算法在不同分布特点及维数的数据集上均取得了较稳定的聚类结果和较高的聚类精度。  相似文献   

8.
传统核可能性C均值(KPCM)算法仅考虑类内的紧密性而忽略了类间的距离关系,在对边界模糊的数据进行聚类分析时,会引起因聚类中心距离小或重合引起的边界点误分问题。为解决上述问题,在核可能性C均值基础上引入高维特征空间中的类间极大惩罚项和调控因子[λ],构造了全新的目标函数,称为极大中心间隔的核可能性C均值(MKPCM)聚类算法。该算法通过类间极大惩罚项使类间距离极大化,并利用调控因子[λ]合理控制类间距,较好地避免了类中心间距离小或重合的现象。通过大量的实验证明,算法对于边界模糊的数据聚类效果优于传统的聚类算法;在图像分割的实际应用中,算法也明显优于传统的聚类算法。  相似文献   

9.
针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题, 提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis) RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的相似性, 以提出的基于KNN和Parzen窗的局部密度计算方法计算每个对象的密度, 通过线性回归和残差分析进行聚类中心预选取, 然后以提出的聚类中心目标优化模型确定真正的聚类中心, 最后将其他数据对象按照距离高密度对象的最小距离划分到相应的簇中, 形成最终聚类.在合成数据集和UCI数据集上的实验结果验证了算法的有效性.与同类算法相比, RA-Clust具有较高的聚类精度.  相似文献   

10.
煤与瓦斯突出预测在矿井的安全生产中具有重要影响;蚁群算法是最新提出的新型寻优策略,具有良好的克服局部极值、获得全局极值的能力;通过对蚁群算法和模糊聚类算法的深入研究提出了一种新的蚁群-模糊聚类预测算法,利用改进的自适应调整信息素的蚁群算法计算出模糊聚类的个数和初始聚类中心,再利用模糊聚类算法对煤与瓦斯突出进行预测;对平八矿历年煤与瓦斯突出数据进行验证预测的结果表明,该方法与传统的模糊聚类预测方法相比具有较强的自适应能力和较好的预测效果.  相似文献   

11.
改进了LF算法,提出了一种基于模糊集理论的蚁群聚类新方法。首先定义了平均距离,其次在“相似”的概念上引入模糊集理论,定义了数据对象与其邻域内对象相似程度的隶属函数,最后该数据对象的拾起或放下由隶属度与置信水平λ相比较来决定。该算法避免了LF算法中不相似的数据对象本该被拾起而可能未被拾起,相似的数据对象本该被放下而可能未被放下的弊端,并简化了LF算法。  相似文献   

12.
提出了一种改进的基于对称点距离的蚂蚁聚类算法。该算法不再采用Euclidean距离来计算类内对象的相似性,而是使用新的对称点距离来计算相似性,在处理带有对称性质的数据集时,可以有效地识别给定数据集的聚类数目和合适的划分。在该算法中,用人工蚂蚁代表数据对象,根据算法给定的聚类规则来寻找最合适的聚类划分。最后用本算法与标准的蚂蚁聚类算法分别对不同的数据集进行了聚类实验。实验结果证实了算法的有效性。  相似文献   

13.
Aggregation pheromone density based data clustering   总被引:1,自引:0,他引:1  
Ants, bees and other social insects deposit pheromone (a type of chemical) in order to communicate between the members of their community. Pheromone, that causes clumping or clustering behavior in a species and brings individuals into a closer proximity, is called aggregation pheromone. This article presents a new algorithm (called, APC) for clustering data sets based on this property of aggregation pheromone found in ants. An ant is placed at each location of a data point, and the ants are allowed to move in the search space to find points with higher pheromone density. The movement of an ant is governed by the amount of pheromone deposited at different points of the search space. More the deposited pheromone, more is the aggregation of ants. This leads to the formation of homogenous groups of data. The proposed algorithm is evaluated on a number of well-known benchmark data sets using different cluster validity measures. Results are compared with those obtained using two popular standard clustering techniques namely average linkage agglomerative and k-means clustering algorithm and with an ant-based method called adaptive time-dependent transporter ants for clustering (ATTA-C). Experimental results justify the potentiality of the proposed APC algorithm both in terms of the solution (clustering) quality as well as execution time compared to other algorithms for a large number of data sets.  相似文献   

14.
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使...  相似文献   

15.
In clustering algorithms, choosing a subset of representative examples is very important in data set. Such “exemplars” can be found by randomly choosing an initial subset of data objects and then iteratively refining it, but this works well only if that initial choice is close to a good solution. In this paper, based on the frequency of attribute values, the average density of an object is defined. Furthermore, a novel initialization method for categorical data is proposed, in which the distance between objects and the density of the object is considered. We also apply the proposed initialization method to k-modes algorithm and fuzzy k-modes algorithm. Experimental results illustrate that the proposed initialization method is superior to random initialization method and can be applied to large data sets for its linear time complexity with respect to the number of data objects.  相似文献   

16.
熊伟超  蒋瑜 《计算机应用研究》2023,40(10):3053-3058
针对LF蚁群聚类算法没有区分数据集属性重要度、算法效率低和聚类效果不稳定的问题,提出一种基于熵权的全局记忆LF算法(weighted global ant colony optimization, WGACO)。该算法首先通过熵权法计算各属性熵权,修改欧氏距离计算公式,以提升聚类精度;使用权重最大的属性值对数据对象进行初始化,增强聚类效果的稳定性;引入全局记忆矩阵减少蚂蚁的无效移动,提升算法效率;加入算法的收敛条件,提升算法实用性。选取UCI数据库中的7个真实数据集和3个人工生成的数据集进行数值实验,并与GMACO、SMACC、ILFACC三种改进LF的算法进行比较,实验结果表明,所提算法在精度、算法效率和稳定性上都有比较好的提升,在处理高维数据上也有较好的表现。最后,WGACO在商场会员用户细分上表现良好,体现了其实用价值。  相似文献   

17.
Ant-based clustering is a type of clustering algorithm that imitates the behavior of ants. To improve the efficiency, increase the adaptability to non-Gaussian datasets and simplify the parameters of the algorithm, a novel ant-based clustering algorithm using Renyi Entropy (NAC-RE) is proposed. There are two aspects to application of Renyi entropy. Firstly, Kernel Entropy Component Analysis (KECA) is applied to modify the random projection of objects when the algorithm is run initially. This projection can create rough clusters and improve the algorithm's efficiency. Secondly, a novel ant movement model governed by Renyi entropy is proposed. The model takes each object as an ant. When the object (ant) moves to a new region, the Renyi entropy in its local neighborhood will be changed. The differential value of entropy governs whether the object should move or be moveless. The new model avoids complex parameters that have influence on the clustering results. The theoretical analysis has been conducted by kernel method to show that Renyi entropy metric is feasible and superior to distance metric. The novel algorithm was compared with other classic ones by several well-known benchmark datasets. The Friedman test with the corresponding Nemenyi test are applied to compare and conclude the algorithms’ performance The results indicate that NAC-RE can get better results for non-linearly separable datasets while its parameters are simple.  相似文献   

18.
The success of image analysis depends heavily upon accurate image segmentation algorithms. This paper presents a novel segmentation algorithm based on artificial ant colonies (AC). Recent studies show that the self-organization of ants is similar to neurons in the human brain in many respects. Therefore, it has been used successfully for understanding biological systems. It is also widely used in many applications in robotics, computer graphics, etc. Considering the features of artificial ant colonies, we present an extended model for image segmentation. In our model, each ant can memorize a reference object, which will be refreshed when it finds a new target. A fuzzy connectedness measure is adopted to evaluate the similarity between target and the reference object. The behavior of an ant is affected by the neighbors and the cooperation between ants is performed by exchanging information through pheromone updating. Experimental results show that the new algorithm can preserve the detail of the object and is also insensitive to noise.  相似文献   

19.
In this paper, we show how one can take advantage of the stability and effectiveness of object data clustering algorithms when the data to be clustered are available in the form of mutual numerical relationships between pairs of objects. More precisely, we propose a new fuzzy relational algorithm, based on the popular fuzzy C-means (FCM) algorithm, which does not require any particular restriction on the relation matrix. We describe the application of the algorithm to four real and four synthetic data sets, and show that our algorithm performs better than well-known fuzzy relational clustering algorithms on all these sets.  相似文献   

20.
面向混合属性数据集的改进半监督FCM聚类方法   总被引:1,自引:0,他引:1  
李晓庆  唐昊  司加胜  苗刚中 《自动化学报》2018,44(12):2259-2268
针对混合属性数据集聚类精度低的问题,本文提出一种基于改进距离度量的半监督模糊均值聚类(Fuzzy C-means,FCM)算法.首先,在数据集中针对类别属性进行预处理,并设置相应的相异度阈值;将传统聚类距离度量与改进的Jaccard距离度量结合,确定混合属性数据集的距离度量函数;最后,将所得距离度量函数与传统半监督FCM算法相结合,并在滚动轴承的不同复合故障数据的特征集中进行聚类.实验表明,该算法能在含无序属性的混合属性数据集的聚类中取得更好的聚类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号