首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
周晨曦  梁循  齐金山 《自动化学报》2015,41(7):1253-1263
提出了一种基于约束动态更新的半监督层次聚类算法. 与现存的半监督层次聚类算法类似, 该算法也使用了必连和不连约束. 但不同的是, 该算法并不是在对满足必连约束的数据样本点进行预先划分的基础上依据不连约束进行聚合操作, 而是首先将约束扩展为一个闭包, 然后在这此基础上直接依据不连约束进行聚合操作, 并在聚合的过程中依据聚类结果动态地更新必连和不连约束, 以保证最终的聚类结果同时满足必连和不连约束. 该算法的优势在于省略了对必连约束的数据样本点进行预先划分的步骤, 这一改进能够保证数据样本点获得更为合理的聚合顺序, 从而得到更为准确的聚类结果. 本文具体给出了该算法基于Ward 层次聚类算法的实现, 提出了C-Ward算法.实验表明, 与其他同类算法相比, 无论是在人工模拟数据集还是在现实数据集上, 本文提出的算法都表现出了更高的准确性和更强的稳定性.  相似文献   

2.
偏向参数和阻尼因子是影响AP聚类算法聚类效果的两个重要参数,但他们均取固定值。随着数据量的改变,原有参数取值不能使算法聚类结果达到最优。鉴此,本文提出自适应AP聚类算法,当数据量发生改变时,自动调整并获取最优的偏向参数和阻尼因子,最终得到最优聚类结果。与原来算法相比,改进后的算法能自动消除震荡,还可获取最优聚类结果,提高聚类结果的准确性和算法快速性。通过人造数据集和Iris数据集实验,证明了自适应AP聚类算法的有效性。  相似文献   

3.
一种特征加权的聚类算法框架   总被引:3,自引:0,他引:3  
高滢  刘大有  徐益 《计算机科学》2008,35(10):152-154
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架.该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数.欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架.基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性.  相似文献   

4.
王亮  王士同 《计算机工程》2012,38(1):148-150
针对样本间的不均衡性,提出一种基于成对约束的动态加权半监督模糊核聚类算法。在传统模糊聚类算法中加入半监督学习机制,通过Mercer核将原数据空间映射到特征空间,为特征空间中的每个向量分配一个动态权值,由此得到新的目标函数,并结合一种简单的核参数选择方法实现数据分类。理论分析和实验结果表明,与模糊核聚类算法及成对约束的竞争群算法相比,该算法具有更好的聚类效果。  相似文献   

5.
仿射传播(Affinity propagation,AP)聚类算法是将所有待聚类对象作为潜在的聚类中心,通过对象之间传递的可靠性和有效性信息找到合适的聚类中心,从而计算出相应的聚类结果,但不适用子空间聚类。将粒度计算引入到仿射传播聚类算法中,提出属性与样本同步粒化的AP熵加权软子空间聚类算法(Entropy weighting AP algorithm for subspace clustering based on asynchronous granulation of attributes and samples,EWAP)。EWAP首先去除冗余属性,然后在每次聚类的迭代过程中修改属性的权重值。在满足一定条件迭代终止时,就会得到构成各兴趣度子空间的属性权重值,从而得到属性集的粒化结果以及相应的子空间聚类结果 。理论与实验证明EWAP算法既保留了AP算法的优点,又克服了该聚类算法不能进行子空间聚类的不足。  相似文献   

6.
传统的聚类融合方法通过融合所有成员实现融合,无法彻底消除劣质聚类成员对融合质量的影响,而从聚类成员的选择和加权两方面进行聚类融合,即先采用两两融合技术代替融合所有聚类结果进行聚类成员选择,然后进行基于属性的聚类成员加权,在理论上具有更好优越性。通过对真实数据和模拟数据的实验发现,该算法能有效处理聚类成员的质量差异,比传统聚类融合能得到更好的聚类结果,具有较好可扩展性。  相似文献   

7.
提出一种混合约束的半监督聚类算法(HCC),综合考虑标号点和成对点约束信息的作用,使两种先验信息在聚类的过程中能以不同的方式发挥作用.给出理论推导、具体算法步骤、实验及分析.实验表明在HCC算法中,标号点对提高聚类结果的作用要比成对点约束信息的作用更明显,算法得到的CRI、聚类数、运行时间等多项指标都比对比算法好.  相似文献   

8.
甘月松  陈秀宏  陈晓晖 《计算机科学》2015,42(1):232-235,267
Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于大规模数据集,AP是一种快速、有效的聚类方法.但是AP算法在聚类结构复杂的(非团状)数据集上得到的效果并不是很好.因此,在AP的基础上加入一个merge过程,将AP算法改进为M-AP算法,可以有效地解决这种问题.而当样本数目比较大时,将CVM压缩算法融入其中,可以有效地解决大样本问题.  相似文献   

9.
10.
半监督加权模糊C均值聚类算法   总被引:2,自引:1,他引:1       下载免费PDF全文
江秀勤 《计算机工程》2009,35(17):170-171
对于团状、每类样本数相差较大的数据集,FCM算法和半监督模糊C均值聚类算法都不是最佳聚类方法,因为它们对数据集有等划分趋势。针对这种情况,利用样本点分布密度大小作为权值,结合半监督学习方法,提出半监督点密度加权模糊C均值聚类算法。在半监督学习过程中,对于求极值的问题采用模拟退火算法。结果证明,点密度加权模糊C均值聚类算法确实能提高聚类精度。  相似文献   

11.
改进的半监督模糊聚类算法   总被引:1,自引:0,他引:1  
针对Grira等近期提出的利用点对约束的半监督模糊聚类算法,其约束项与竞争聚类算法(CA)的目标函数之间数量级不一致,造成隶属度调整过度的问题,在重新定义目标函数的基础上提出一种改进算法,约束惩罚函数采用约束点对中两个样本新的联合表达式,使数量级与经典模糊聚类算法一致.实验结果显示,新算法的约束项与CA目标函数之间能很好地协调合作,并能通过对模糊隶属度的适度调整,实现更准确的聚类.  相似文献   

12.
现有的自适应亲和传播聚类存在聚类时间长、精度低的缺点,提出了一种结合半监督的改进自适应亲和传播聚类(SAAP)。它首先利用半监督学习更新相似度矩阵,而后在亲和传播聚类的基础上,通过基于二分法判断实现自适应搜索有效聚类数空间,最后由加权评价函数确定最佳聚类。经实验证明,SAAP算法可以更快速地扫描有效聚类空间,并能够得到较小的错分率和较高的有效性评价。  相似文献   

13.
针对网络故障检测中利用先验知识不足和多数谱聚类算法需事先确定聚类数的问题,提出一种新的基于成对约束信息传播与自动确定聚类数相结合的半监督自动谱聚类算法。通过学习一种新的相似性测度函数来满足约束条件,改进NJW聚类算法,对非规范化的Laplacian矩阵特征向量进行自动谱聚类,从而提高聚类性能。在UCI标准数据集和网络实测数据上的实验表明,该算法较相关比对算法聚类准确率更高,可满足网络故障检测的实际需要。  相似文献   

14.
半监督FCM聚类算法目标函数研究   总被引:3,自引:1,他引:3       下载免费PDF全文
分析了现有半监督FCM算法目标函数的物理意义和平衡系数α的选取,说明Stutz对Pedrycz目标函数的修改使半监督的物理意义更清楚,它在α=1,0时均退化为标准FCM算法,给出了修改后SS-FCM算法的交替求解过程。实验结果:(1)修改算法与Pedrycz算法有相同的半监督作用和清楚的物理解释;(2)对labeled样本采用FCM算法赋值比用随机数的收敛稳定性高;(3)优选的少量labeled样本,使用模糊协方差的SS-CFCM算法提高了聚类准确性和收敛速度。  相似文献   

15.
自适应加权(AOW)分簇算法是移动自组网中一种性能良好的分簇算法,在这里被引入无线传感器网络,并针对其算法复杂的缺点,提出一种简化的MAOW(mended AOW)算法。仿真结果表明:MAOW算法具有较低的复杂性,并在负载平衡性上有较大提升。介绍分簇算法的背景和相关定义,说明几种已有算法的特点,接着引入自适应加权算法,又重点提出改进的MAOW算法,最后,通过仿真对全部算法进行分析比较。  相似文献   

16.
经典的无监督聚类算法快速、简单且可以直接对大规模数据集进行划分,但是由于网络结构较为复杂,划分的准确度并不高。为此,提出一种基于主动学习的纠错式半监督社区发现算法ESCD(error correction semi-supervised community detection algorithm),将传统的K-means算法进行分步计算,并且在聚类的过程中加入成对约束。根据先验信息保留正确的划分,纠正错误的划分来改变网络的连接关系,使网络具有更明显的块结构,当节点与聚类中心的距离不再变化时划分结束。实验结果表明,与现有的社区发现算法相比,ESCD算法具有更高的精度,且所需的监督信息远远小于其他半监督算法。  相似文献   

17.
针对半监督聚类算法性能受到成对约束数量多寡的限制问题,现有的研究大都依赖于原始成对约束的数量。因此,首先提出了基于灰关联分析的成对约束初始化算法(initialization algorithm of pair constraints based on grey relational analysis,PCIG)。该算法通过均衡接近度计算数据对象间的相似度,并根据相似度的取值来确定可信区间,然后借鉴网络结构初始化方法来扩充数据对象间的成对关系。最后,将其应用于标签传播聚类算法。通过在五个基准数据集上进行实验,基于改进成对约束扩充的标签传播聚类算法与其他方法相比NMI值和ARI值有所提升。实验结果证明了改进成对约束扩充可以有效改善标签传播算法的聚类效果。  相似文献   

18.
摘要:针对滚动轴承聚类故障聚类模式识别方法中需要预先设定聚类数目问题,提出了一种基于局部均值分解(Local Mean Decompoeiton, LMD)与基本尺度熵(Base Scale Entropy, BSE)的相邻传播(Affinity Propagation, AP)滚动轴承聚类故障诊断方法。该方法首先使用LMD模型将滚动轴承的不同状态振动信号分解为若干乘积函数(Production Function, PF)。其次使用BSE计算前3个PF的熵值(BSE1-BSE3),并将其作为AP的输入进行滚动轴承的故障模式识别。最后实验结果表明在不需要划分聚类中心个数的前提条件下AP聚类模型对滚动轴承的故障划分效果较好。 关键词:局部均值分解;基本尺度熵;滚动轴承;故障诊断;AP聚类算法  相似文献   

19.
孪生支持向量机TWSVMs分类过程的计算量和样本的数量成正比,当样本个数较多时,其分类过程将会比较耗时。为了提高样本集的稀疏性,从而提高TWSVMs的分类速度,提出了一种基于AP聚类的约简孪生支持向量机快速分类算法FCTSVMs-AP。首先对原始数据集进行AP聚类操作。聚类的中心为约简后新的样本集,按照分类误差最小的原则构建优化模型,用二次规划方法求解新的决策函数的系数,并证明了当样本集压缩时,收紧新的快速决策函数和原始决策函数之间的误差等价于在样本空间对原始数据集进行AP聚类操作。在人工数据集和UCI数据集上的实验表明,保持分类精度的损失在统计意义上不明显的前提下,FCTSVMs-AP可以通过有效压缩样本数量的方式提高分类速度。  相似文献   

20.
针对FCM算法应用于基因表达数据分析时存在的局限性,提出一种特征加权自适应FCM算法。该算法在FCM算法的基础上引入数据集预处理机制,可依据数据集的分布特征自适应地获取分类数目和初始聚类中心,并通过ReliefF算法实现特征权值的自动确定。同时,新算法考虑了不同属性对分类贡献的差异,在FCM算法中引入特征权重。将算法应用于真实基因表达数据集,实验结果表明,算法能够自适应地确定聚类数目、获得稳定性较好的聚类结果,而且具有较高的聚类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号