首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

2.
针对传统半监督支持向量机的高斯核函数无法恰当描述流形数据特性,从而导致流形数据分类精度下降的问题,提出一种基于谱聚类的聚类核半监督支持向量机.利用谱聚类方法在特征向量空间中对原始样本数据进行重新表述,使得在新表述中同一聚类中的样本能够更好地积聚在一起,构建聚类核函数,并进而构造聚类核半监督支持向量机,使样本更好地满足半监督学习必须遵循的聚类假设.研究结果表明:聚类核半监督支持向量机对未标记样本的分类精度高且算法性能稳定,对控制参数的设置不敏感,适于解决流形数据的分类问题.  相似文献   

3.
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS)。该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类。同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果。实验结果表明该文提出的算法是有效可行的。  相似文献   

4.
为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。  相似文献   

5.
近邻传播聚类算法(affinity propagation, AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi supervised clustering algorithm based on affinity propagation, 2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation, SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。  相似文献   

6.
为了解决高维数据维数灾难影响数据相似性度量的问题,提出一种流形自适应结构化子空间聚类方法,通过构造相似矩阵获取数据的全局和局部流形结构信息,将亲和矩阵的构造和聚类分割统一到一个优化框架中,得到相似图和最终的聚类结果.在YALE、JAFFE、COIL20等10个真实数据集上与多个经典聚类算法进行对比试验,提出的算法在Ac...  相似文献   

7.
在入侵检测系统中,未知标签数据容易获得,标签数据较难获得。文中提出了一个基于半监督聚类的入侵检测模型,利用少量的标签数据和大量未知标签数据生成self/nonself行为库,进而得到self/nonself模式库。实验结果表明,该模型有较高的检测率。  相似文献   

8.
为增强个体与隐私信息的保护力度,提高数据效用和降低时间代价,提出半监督聚类的(α,k)匿名模型,并设计算法予以实现,分析了算法时间复杂度.针对数据集包含数值属性和分类属性的特点,把数值属性和分类属性映射到相同的度量空间进行运算,以相异矩阵表示数据集元组之间的距离,使相同或者相近的元组有效地聚集到同一个簇内.把高敏感度属...  相似文献   

9.
针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis, PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用少量已标记样本和成对约束信息,通过引入竞争凝聚让系统主动学习,以实现对大量未知样本的检测。在入侵检测数据集和UCI基准数据集上的实验结果表明,该算法能有效提高系统的性能。  相似文献   

10.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

11.
多标记学习中通常存在大量未标记示例,本研究结合协同训练(Co-training)方法充分利用数据集中的未标记示例,在数据集上选取局部k NN(k nearest neighbor)和全局k NN进行训练得到两个分类器,分类器分别标记未标记示例并相互更新训练集。协同训练过程不断迭代进行,直至训练完成。试验结果表明,该方法性能均优于其他多标记学习算法。  相似文献   

12.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

13.
自适应的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值聚类算法对聚类数预先不可知的缺陷,提出了自适应的模糊C均值聚类算法,该算法利用已有的有效性函数自动确定聚类数目,继而进行模糊聚类,实验表明,该方法无须人工的干预,并且具有良好的有效性和可行性.  相似文献   

14.
针对表面肌电信号较为复杂,且获取标注样本代价较大的问题,提出了基于半监督boosting学习的表面肌电信号多类模式识别方法。与目前半监督boosting算法着重解决两类分类问题,将多类问题转化为多个两类问题不同,本文方法通过联合分类置信度及样本间相似度确定每次迭代过程中未标注样本的预测类别,达到利用未标注样本提高多类问题正确识别率的目的,避免了将某一样本划分多类的问题。由实验分析可知,本文算法与现有半监督boosting算法相比,正确识别率更高,对于不同标注样本数及不同基分类器具有较好的鲁棒性。本文方法降低了人工标注代价,对多类问题具有良好的识别效果。  相似文献   

15.
提出一种基于全局距离和类别信息的邻域保持嵌入算法。该方法在使用欧氏距离构造邻域图中,加入表征全局距离的全局因子和表示类别信息的函数项,全局因子可以使分布不均匀的样本变得平滑均匀,类别信息可以使同类样本点紧凑异类样本点疏离,通过提高所选邻近点的质量,优化数据的局部邻域,使降维后的数据具有更好的可分性。试验结果表明,该算法具有较高的准确率,优于传统的邻域保持嵌入算法。  相似文献   

16.
针对物联网环境下实时数据挖掘中资源约束的特点,分析了快速有效地挖掘抽取知识的方法。在K-means算法的基础上,结合RA-Cluster算法,提出了ARRA-Kmeans聚类算法。并基于环境资源约束和时间约束的特点,引入自适应聚类方法和滑动窗口技术,对网络节点的实时数据进行挖掘。实验结果表明,随着流数据量的增大,ARRA-Kmeans算法在处理实时动态的数据时具有较好的效果,聚类精度较高,处理时间较快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号