首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 131 毫秒
1.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷, 提出基于进化思想的聚类算法及其类簇融合算法, 该算法将K均值聚类算法嵌入进化聚类算法框架中, 通过调整距离倍参, 将数据逐渐划分, 在此过程中自动确定类簇数目, 提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法, 将相似度大的类簇进行融合, 使得k值逐渐趋向真实值. 实验表明, 该方法具有良好的实用性.  相似文献   

2.
针对图像的低级特征表示与高级概念之间的语义鸿沟,本文利用密度聚类获得的簇分布信息和多示例学习框架在区分歧义性对象上的特点,提出了一个基于区域特征密度聚类和多示例学习的图像分类方法(DCRF-MIL)。该方法首先将每个图像分割为多个区域,将所有区域组成一个集合,在这个区域集合上,使用密度聚类算法学习到区域特征的簇分布信息;然后,将图像看作包,区域看作包中的示例,基于区域特征的簇分布信息,将包映射为簇分布空间上的一个向量作为包的特征,使得包特征带有图像区域的语义信息;最后,使用支持向量机算法,在带有包特征的训练集上训练分类器,对测试图像进行分类。在Corel图像集和MUSK分子活性预测数据集上的实验表明,DCRF-MIL算法具有分类精度高和参数易于选择等特点。  相似文献   

3.
为了提高算法聚类精度,降低算法聚类耗时,根据支持向量聚类算法的统计性原理本文提出了一种改进的支持向量聚类算法。该算法通过预处理数据,提高样本质量;成功解决内部支持向量点扰乱提取簇轮廓的问题;利用支持向量点寻找局部最优点,采用SEP进行成对抽样确定簇标签。理论分析和仿真结果表明,改进算法有效的提高了聚类精度高,降低了算法的复杂度,取得了良好的聚类效果  相似文献   

4.
为了解决2014年在Science上提出的快速密度峰值聚类(CFDP)算法存在的自动选择时误选和漏选中心点、簇的数量需要主观先验判断、算法使用受场景局限的缺陷,从半监督角度出发,结合集成学习思想提出半监督约束集成的快速密度峰值聚类(SiCE-CFDP)算法.SiCE-CFDP算法使用相对密度方式度量节点密度,从多角度分析决策图,自动选择候选中心点,并最终自动确定簇的数量.在只标注有限约束关系的前提下,算法能以集成学习指导约束信息的扩充,提升聚类性能.在方法验证中,通过3个人工数据集、4个公开数据集以及1个空调系统数据集进行仿真研究.结果表明,在相同的约束量前提下,针对大样本数据,SiCE-CFDP算法相比其他半监督聚类算法具有更高的聚类精度.  相似文献   

5.
用于不同密度聚类的多阶段等密度线算法   总被引:10,自引:1,他引:9  
多阶段等密度线算法是在基于网格的等密度线聚类算法的基础之上 ,采用多阶段的聚类方式来解决分布密度变化较大的数据集的聚类分析问题. 该算法能够找出分布密度不同的各种类别 ,并能很快地处理高维数据集. 此外 ,还能有效地对时间序列数据集进行聚类.  相似文献   

6.
基于核的单类分类器研究   总被引:1,自引:0,他引:1  
以统计学习理论为背景,以核方法为基础的两类典型单类分类算法:单类支持向量机(OCSVM)和支持向量数据域描述(SVDD),均以降低VC维为目标,其中前者通过寻找一个远离原点的超平面,使目标数据所在的正半空间尽量最小;而后者通过寻找一个包含大部分目标数据的最小超球,实现体积最小化.围绕上述两算法,已有大量改进形式出现.本文以此为主线,分别从模型构建、模型改进和数据预处理的角度,进行了回顾和阐述,并对各算法的特点给出了相应的总结.  相似文献   

7.
针对给定的大规模数据集的回归估计问题,提出基于支持向量机的模糊回归估计方法.该方法把复杂的数据集看作多个群体的混合,每个群体采用单一的回归模型进行描述,使得大规模数据集的回归估计问题变成了一个多模型估计问题.在此基础上把支持向量机与模糊C聚类结合起来得到基于支持向量机的模糊回归模型,并给出了实现该模型回归估计的算法.该方法对大规模的数据样本进行模糊C聚类,并回归估计各聚类的数据样本.数值仿真结果表明,该方法在聚类数据样本的同时能实现多个模型的回归估计,而且模糊隶属度的初始化影响要小于其他的模糊回归估计方法.  相似文献   

8.
一种基于高斯混合模型的无监督粗糙聚类方法   总被引:3,自引:0,他引:3  
针对数据统计分布的随机性和复杂性,从统计聚类的角度出发,采用高斯混合模型来描述整个数据的概率密度函数,提出了一种基于高斯混合模型的粗糙聚类分析方法.该方法首先利用粗糙集理论的不可区分关系性质以及生成的逻辑规则来设定EM算法的初始近似参数,然后通过Expectation-M axim ization(EM)算法估计各分量概率密度分布的最大似然参数集,最后通过密度分布概率大小来确定类别的归属.与传统的k-m eans聚类算法的试验结果比较表明,该方法是有效的,并且具有较高的聚类精度,用规则集来描述聚类的结果具有可解释性和合理性.  相似文献   

9.
结构大间隔单类分类器   总被引:1,自引:1,他引:0  
目标数据呈簇分布、基于超平面的单类分类器要求嵌入结构信息时,必须分别考虑各簇数据对超平面的影响,为此,提出可用于簇分布的结构大间隔单类分类器(structural large margin one-class classifier,SLMOCC)。该算法通过分别约束各簇数据到超平面的马氏距离,并最大化最小马氏间隔,保证目标数据落入正半空间的同时,充分利用数据的簇结构信息,通过序列二次锥规划优化方法线性搜索到最优超平面。为捕捉数据簇结构,SLMOCC采用凝聚型层次聚类并借助拐点确定聚类数目,最后通过人工数据和UCI数据集与相关算法比较,验证了SLMOCC的有效性。  相似文献   

10.
密度峰值聚类算法(DPC)是近年来提出的一种新的密度聚类算法,其核心基于局部密度和相对距离。该算法在定义局部密度以及相对距离时直接用欧式距离,导致在一些稀疏差异大及长弧形的类簇聚类效果差,且一步分配策略的鲁棒性不佳。提出基于随机游走的密度峰值聚类算法(RW-DPC),即引入随机游走首次到达模型来刻画数据点之间的相似性,重新定义数据点的局部密度,且给出一种新的样本分配策略。对比在人工数据集和UCI真实数据集上与其他聚类算法的实验结果,说明对于密度不均匀及弧形类的数据集,本文算法的聚类效果优于密度峰值聚类算法以及其他算法。  相似文献   

11.
基于人工免疫核聚类的支持向量数据描述方法   总被引:1,自引:0,他引:1  
为使支持向量数据描述(SVDD)能应用于无监督多分类情况,提出了一种基于人工免疫核聚类的支持向量数据描述(AIKCSVDD)方法。AIKCSVDD将人工免疫核聚类产生的记忆抗体作为目标数据点,使用SVDD方法进行多类学习。在AIKCSVDD中,一方面实现了用核聚类方法解决各类数据边界不清晰的长处与免疫网络聚类方法全局收敛、不需要先验知识的优点的有机结合;另一方面,由于用记忆抗体代替原始数据进行学习,从而更好展现了原始数据的全局分布特征。与基于K-means聚类multi-SVDD方法相比,AIKCSVDD不需要事先指定分类数;在人工数据集和UCI数据集上的实验表明,在为multi-SVDD指定分类数的情况下,AIKCSVDD仍比multi-SVDD具有更好的分类性能。  相似文献   

12.
为了解决大规模数据中的异常检测问题,提出了基于支持向量数据描述(SVDD)的高效离群数据检测算法。该算法的核心思想为:首先利用SVDD获得包含单类数据的最小球形边界,然后通过该边界对未知样本数据进行分类,并利用最小闭包球算法对SVDD分类器进行优化求解。在UCI机器学习数据集和入侵检测数据集上将该算法与其他离群数据检测算法进行了实验比较,结果表明,该算法不仅获得了更高的检测准确率,而且具有较低的运行时间。  相似文献   

13.
一种基于聚类集成的无监督特征选择方法   总被引:1,自引:0,他引:1  
提出了一种无监督的特征选择方法,其基本思想是利用聚类来指导特征选择,对于无类别标签的数据样本集,先进行聚类获得数据类标签,再利用ReliefF算法进行特征选择.采用聚类集成方法解决一些聚类结果的不稳定问题,最终特征选择结果通过多次特征选择综合得到.实验结果表明,该算法具有良好的特征选择性能,在去除无关或冗余特征后可进一步提高聚类质量.  相似文献   

14.
聚类分析是数据挖掘领域中一种非常有用的技术,它用于从大量数据中寻找隐含的数据分布模式,主要有分割法、层次法、密度法、网格法和模型法等。该文主要讨论数据挖掘中一种基于密度和网格的聚类分析算法及其在客户关系管理中的应用。该算法具有较高的聚类效率而且容易实现,可以发现任意形状的聚类,时间复杂度低,聚类精度高,适用于数据的批量更新。该文还提出增量式聚类技术,它不仅能够利用前期聚类的结果,充分提高聚类分析的效率,而且可以降低维护知识库所带来的巨大开销。实验证明了算法的有效性。  相似文献   

15.
为有效解决可变目标在跟踪过程中的"漂移"问题,提出一种基于自适应先验表观模型的目标跟踪方法。该方法首先在一致架构内融合HDP-EVO演化聚类模型和在线Boosting学习。以Dirichlet过程为先验分布,对总体表观示例进行聚类分析,获得随时间自适应演化的表观类先验知识,进而利用共享的表观类混合比例的权重平滑约束各时刻的表观模型。改进Gibbs抽样过程,使之能融入目标示例的分类误差,并交替迭代地从数据中自主学习聚类和表观分类器。最后,根据表观模型中各表观类的权重系数组合它们的分类评分去定位目标位置。仿真实验表明新方法学习的表观模型能较鲁棒地自适应于目标的表观变化,提高了跟踪精度。  相似文献   

16.
17.
借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,然后用SVDD方法寻找包含大部分样本最小超球,保留各自支持向量样本点作为识别模型;然后计算测试样本距各球心距离,距离近者为其所属类别。该模型简单,适合P2P流量识别环境,克服了现有基于机器学习的流量识别方法在多类分类中模型复杂、数据不平衡等缺点。实验结果表明,该模型具有较高的分类精度和可靠性。  相似文献   

18.
局部密度嵌入的结构单类支持向量机   总被引:1,自引:1,他引:0  
针对现有单类分类器对目标数据先验信息考虑的不足,在结构单类支持向量机(structured one-class support vector machine,SOCSVM)中嵌入局部密度信息,提出局部密度嵌入的结构单类支持向量机(SOCSVM with local density embedding ldSOCSVM)。借助K近邻(K-nearest neighbor, KNN)揭示目标数据局部密度,并进一步诱导出权重因子作用于样本点。该算法充分利用目标数据的全局信息及局部密度信息,从而提高分类器的泛化能力。UCI数据集上的实验结果验证了ldSOCSVM的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号