首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
由于当今的网络数据是海量的,因此科研人员对某些问题进行研究时需要将不同属性的数据从中提取出来,然而在提取这些数据之前需要将相同数据进行聚类。数据聚类的过程,也就是寻找数据最优属性的过程,然而人工蚁群就是一种寻找问题最优解的算法,因此在本文中再次将蚁群算法在聚类中进行应用。由本文提出的聚类算法可以分为两个部分,第一部分是:通过相似性算法来衡量数据之间的相似度,第二部分是:根据第一部分的计算结果,再采用蚁群算法为需要聚类的数据选择不同的聚类中心,从而对不同属性的数据进行聚类,经过以上两个过程的计算,可以实现对数据的聚类。在本文中进行数据聚类时采用的相似性度量来代替距离的计算,是本文创新点之一,采用蚁群算法在聚类过程中来选择聚类中心也是本文的创新所在。  相似文献   

2.
方向相似性聚类方法DSCM   总被引:10,自引:2,他引:10  
针对方向性数据提出了一种鲁棒的基于方向相似性度量的聚类方法DSCM.DSCM首先基于方向性度量构造目标函数,然后通过不动点迭代法对目标函数优化,获得各个样本的最终稳定状态,最后基于样本的最终状态集利用层次聚类技术实现聚类.DSCM的优势在于对方向性数据聚类时不依赖于具体的初始化参数,且能自组织地求解最优聚类划分因而有很好的鲁棒性.通过实验证实了DSCM的有效性以及对已有的两个传统方向性聚类算法的优越性.  相似文献   

3.
受不确定因素降雨难以准确处理的制约以及蚁群聚类算法在搜索空间容易陷入局部最优解和搜索速度慢的特征影响,为了提高滑坡危险性预测的精度,提出一种不确定近似骨架蚁群聚类算法。首先采用Gauss点概率模型来描述不确定数据,对不确定数据进行相似性度量;其次引入信息素重分配和自适应动态变量实现蚁群聚类算法局部信息素和全局信息素更新,提高蚁群聚类算法搜索速度,加载遗传算法避免蚁群聚类算法过早陷入局部最优;最后结合近似骨架理论,构建不确定近似骨架蚁群聚类算法模型,缩减迭代次数,快速搜索出聚类结果。在UCI真实数据集和延安宝塔区滑坡实验数据集上的实验结果显示,不确定近似骨架蚁群聚类 算法具有较高的聚类质量,预测精度达到93.3%,验证了算法在滑坡危险性预测中的可行性。  相似文献   

4.
为了提高蚁群化学聚类算法的聚类效果,通过引入径向基核函数改进蚁群化学聚类算法的相似度度量式,提出了核蚁群化学聚类算法。将核蚁群化学聚类算法用于三个标准数据集合,计算结果表明与蚁群化学聚类算法相比,核蚁群化学聚类算法聚类效果提升显著。将核蚁群化学聚类算法、核自组织神经网络映射算法和基于多项式核的结构化有向树数据聚类算法同时用于Iris数据集合,结果显示三种核聚类算法聚类效果相当。  相似文献   

5.
基于蚁群优化聚类算法的DNA序列分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对目前聚类算法在分析DNA序列数据时的低效性和分类精度低问题,提出一种基于蚁群优化聚类算法(ACOC)的DNA序列分类方法,在密度函数中加入自适应感应量并应用模拟退火中的α-适应量的冷却策略,采用DNA序列分布特征对DNA序列进行特征提取,并将pearson相关系数引入蚁群聚类算法作为相似性度量。在EMBL-DNA数据库中4个数据集上进行性能测试,与统计聚类和k-means算法的比较表明,该方法具有一定的时间和精度的优越性,适于解决大规模DNA序列数据分类问题。  相似文献   

6.
适用于区间数据的基于相互距离的相似性传播聚类   总被引:1,自引:0,他引:1  
谢信喜  王士同 《计算机应用》2008,28(6):1441-1443
符号聚类是对传统聚类的重要扩展,而区间数据是一类常见的符号数据。传统聚类中使用的对称性度量不一定适用于度量区间数据,且算法初始化也一直是干扰聚类的严重问题。因此,提出了一种适用于区间数据的度量--相互距离,并在此度量的基础上采用了一种全新的聚类方法--相似性传播聚类,解决了初始化干扰问题,从而得出了适用于区间数据的基于相互距离的相似性传播聚类。通过理论阐述和实验比较,说明了该算法比基于欧氏聚类的K-均值算法要好。  相似文献   

7.
罗会兰  危辉 《计算机科学》2010,37(11):234-238
提出了一种基于集成技术和谱聚类技术的混合数据聚类算法CBEST。它利用聚类集成技术产生混合数据间的相似性,这种相似性度量没有对数据特征值分布模型做任何的假设。基于此相似性度量得到的待聚类数据的相似性矩阵,应用谱聚类算法得到混合数据聚类结果。大量真实和人工数据上的实验结果验证了CBEST的有效性和它对噪声的鲁棒性。与其它混合数据聚类算法的比较研究也证明了CBEST的优越性能。CBEST还能有效融合先验知识,通过参数的调节来设置不同属性在聚类中的权重。  相似文献   

8.
粗糙的方向性模糊聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
根据高维数据具有方向性的特征,结合概率模糊聚类算法与粗糙集理论提出了一种粗糙的方向性模糊聚类算法。该算法在概率模糊聚类算法中引入了数据方向相似性函数,能对不确定数据进行处理。在算法中利用粗糙集中的下近似集与边界集来确定目标对象函数,属于下近似集的数据在聚类时是确定的,属于边界的数据具有模糊性。实验结果表明,该算法能有效地对高维的方向性数据进行聚类。  相似文献   

9.
牛科  张小琴  贾郭军 《计算机工程》2015,41(1):207-210,244
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响。针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法。该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似度计算函数,并据此构造相似度矩阵。通过在UCI标准数据集上的实验进行分析,结果表明,与标准谱聚类算法相比,该算法的预测精度得到明显提高。  相似文献   

10.
谱聚类算法受到度量中尺度因子的影响,同时传统谱聚类算法通过欧氏距离度量样本间相似性也不准确。针对上述问题,提出一种基于传递距离的谱聚类算法。算法首先通过改进传统谱聚类中的度量方式,用基于传递距离的度量方式度量样本间相似性,并构建传递矩阵,接着用传递矩阵做相似度变换构建拉普拉斯矩阵,最终通过求特征值和特征向量完成聚类。基于传递距离的谱聚类算法在人工数据集及UCI数据集上均取得了良好的聚类结果,具有较好的鲁棒性和有效性。  相似文献   

11.
基于相似性进行文本分类是当前流行的文本处理方法。基于特征隶属度的文本分类相似性度量方法旨在利用特征与文档间的隶属关系度量文档相似性,从而实现文本分类。该方法基于特征与文档的隶属关系,对特征进行全隶属、偏隶属和无隶属词集划分,并基于3种隶属词集定义隶属度函数。全隶属词集隶属于两篇文档,隶属度随权差增大而降低;偏隶属词集仅隶属于其中某一篇文档,隶属度为一个定值;无隶属词集与两篇文档无隶属关系,隶属度为零。在度量相似性时,偏隶属关系高于全隶属关系。由于同类文档词集相近,异类文档词集差异明显,因此,基于特征与文档的隶属度进行相似性度量,可清晰界定词集与类别的隶属关系,提升分类精度。最后,采用数据集20-Newgroups和Reuters-21578对分类有效性进行验证,结果表明基于特征隶属度的相似性度量方法的性能优于目前流行的相似性度量方法。  相似文献   

12.
为实现彩色图像噪声的滤波,基于遗传算法技术构建了一种新型的彩色图像滤波器,在彩色图像的矢量中值滤波过程中,该滤波器利用遗传算法具有寻找全局最优解的能力,获得滤波器窗口的最优权值。从滤波效果看,有一定提高,并进一步提出了一种基于个体相似性的遗传算法:当种群的多样性较好时,采用标准的交叉策略;当种群的多样性较差时,根据个体的相似性选择个体配对,避免相同的个体配对交叉,减少高度相似个体进行配对交叉的概率,从而提高交叉操作的效率。  相似文献   

13.
The major task of clustering is to group an heterogeneous population into unknown groups based on a similarity measure. In order to enhance the robustness and the stability of unsupervised classification solutions, clustering ensembles are used; they are considered to be a powerful tool to deal with this issue. Individual clusterers consolidate the process of decision making through the concept of weighting. The aim is to determine an effective combination method that makes use of the benefits of each clusterer while avoiding its weaknesses. In this paper, we study the problem of combining multiple partitioning without accessing the original features. A genetic algorithm is proposed using three different fitness scores. Following three scenarios: Object Distributed Clustering, Feature Distributed Clustering, and Robust Centralized Clustering, the proposed consensus functions algorithm outperforms three existing ones: Cluster-based Similarity Partitioning Algorithm, HyperGraph Partitioning Algorithm and Meta-Clustering Algorithm.  相似文献   

14.
15.
A novel similarity measure for edge-detection that is robust to varying luminance and contrast is presented. It incorporates a regularization term and employs directional FIR edge filters with hyperbolic tangent profiles to ensure improved noise performance and edge localization compared to classical methods  相似文献   

16.
针对当前反腐倡廉工作中警示训诫防线建设的复杂性,结合反腐败警示训诫防线系统的跨地域、跨平台、分布式等实际需要,采用CORBA和Web Services技术,设计和实现了一种新型的网络环境下反腐败警示训诫防线系统,为警示训诫防线建设提供了一个新型信息服务、业务处理和决策支持平台。文中给出了系统的设计思想、总体架构、基于推理的警示训诫以及主要功能的实现方法,重点对系统的分布式操作、大型分布式数据处理、系统安全机制等问题进行了研究。该系统已在实际反腐倡廉工作取得了成功应用,是计算机和网络技术应用于反腐倡廉工作领域的有效尝试和创新。  相似文献   

17.
本文提出了基于蚁群优化算法的方向过电流保护整定配合的优化模型。首先说明了方向过电流保护的时间特性,然后建立了方向过电流整定优化模型。优化目标是所有主保护动作时间之和最小,考虑了主后备保护配合约束、保护动作时间约束、启动电流约束等。本文所提方向过电流保护为非线性优化问题,提出利用改进蚁群优化算法来求解该模型。最后本文利用IEEE8节点进行仿真分析,并与其他方法进行对比,说明本文所提算法在求解保护配合优化问题的优势。  相似文献   

18.
基于Contourlet广义高斯模型的纹理图像检索   总被引:2,自引:0,他引:2       下载免费PDF全文
Contourlet变换结合了不可分离的方向滤波组,具备小波所不能表达的多方向特性,能有效捕获自然图像的边缘轮廓信息。本文分析了图像Contourlet系数的统计特征,并利用广义高斯函数对各子带系数层进行建模。将此模型应用于基于V isTex的自建纹理图像库,采用矩匹配估计法,提取模型参数集,运用K-L距离计算图像间的相似度。对800幅纹理图像进行检索,本文方法比传统小波方法的平均检索查准率高出约2%到10%不等。实验结果表明,该方法改进了导向纹理的描述。  相似文献   

19.
本文提出了一种新的基于图像颜色分布特征和空间位置特征的图像表示方法以及相应的检索技术,首先使用一个颜色匀质谓词对图像进行多层分解,然后从分解得到的子图像中导出图像特征:“阈值子特征”和“颜色匀质标志子特征”,由于这种图像特征的给数将随着图像分解层数的增加而迅速膨胀,为此利用主分量分析法对其降维,图像的相似度量定义为归一化的子特征间的欧氏距离的线性组合,实验结果表明:使用本文提出的方法获得的图像检索结果能较好地同人们的期望结果保持一致。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号