首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 671 毫秒
1.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

2.
采用属性聚类的高维子空间聚类算法   总被引:4,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

3.
针对位置社交网络的用户轨迹相似性分析,先对签到点分层聚类,然后计算各分层的用户轨迹相似性,加权得到用户总体相似性,提出了一种基于自适应密度聚类的用户轨迹相似性双重加权模型。首先根据签到点的分布,提出基于聚类区域半径的自适应密度聚类算法,对签到点进行聚类,得到符合一定区域半径的自适应分层聚类区域。然后针对用户相似性的计算,提出用户轨迹相似性双重加权模型:基于不同层次上权重不同及同一层次上不同签到区域权重不同两个原则。基于分层聚类区域,计算用户访问各分层的轨迹相似性;由于不同签到区域对相似度的表征能力不同,通过不同权重来计算具体层次上的相似性。进而进行层次上的加权,获得用户总体的相似性。通过仿真,该方法能有效的分析出用户轨迹相似性,具备较高的准确性。  相似文献   

4.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

5.
为了解决高维数据维数灾难影响数据相似性度量的问题,提出一种流形自适应结构化子空间聚类方法,通过构造相似矩阵获取数据的全局和局部流形结构信息,将亲和矩阵的构造和聚类分割统一到一个优化框架中,得到相似图和最终的聚类结果.在YALE、JAFFE、COIL20等10个真实数据集上与多个经典聚类算法进行对比试验,提出的算法在Ac...  相似文献   

6.
多维数据的改进最小生成树聚类算法   总被引:1,自引:1,他引:0  
针对传统的应用于基因表示的最小生成树(MST)聚类算法在时间复杂度和聚类质量上的不足,提出了一种新的应用于数据处理的改进最小生成树(IMST)的聚类算法.该算法在提高构造最小生成树的效率的同时,通过对初步划分的生成树用矩阵表示,以度最大的结点作为聚类中心,再根据中心点算法完成聚类,解决了以往最小生成树算法无法解决的多个簇用短边或长度相同的边相连无法分类的问题,从而提高了聚类速度,改善了聚类的质量.通过对多维数据进行分析,计算各个属性的差异度,得出结论:一些属性的存在对于构造最小生成树有很小的影响或没有影响,删除这些属性列也可以提高效率,达到减少计算复杂性的目的.  相似文献   

7.
为改善近邻传播聚类算法对高维数据的聚类效果,引入马氏距离替换原算法中的欧氏距离,并借助正则化总散度矩阵的奇异值分解实现数据变换预处理,进而在在降维后的变换子空间中对数据集进行聚类。针对Iris、User、Soybean和Vehicle四个数据集,选取适当正则化参数,经仿真实验可见,改进算法的聚类精度在整体上有所提高。  相似文献   

8.
现有的k-均值聚类算法大都是以距离差异为基础的,而同等重要地依赖所有属性的相似性度量会引起误导.传统的k-均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征.而在距离公式中引入一些特征权值后,其聚类结果将依赖于这些权值,从而可以通过调整这些权值优化聚类效果.由于k-均值算法是迭代算法,很难直接确定其权值以优化聚类结果,因此提出了一种通过免疫算法学习权值的方法以改进聚类结果.实验结果显示,该方法确定的权重值在提高聚类效果方面是可行的、有效的.  相似文献   

9.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

10.
近邻传播聚类算法(affinity propagation, AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi supervised clustering algorithm based on affinity propagation, 2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation, SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。  相似文献   

11.
传统吸引子传播聚类算法对数据类型敏感,文中提出一种改进的吸引子传播聚类算法,将JACCARD系数引入对象间属性分布相似度,并与吸引子传播聚类算法结合。仿真实验结果表明,该算法收敛速度快,聚类精度高,明显提高高维稀疏数据的聚类性能。  相似文献   

12.
提出了一种基于特征加权的IB算法-wsIB算法,该算法融入了ReliefF算法,对特征进行加权,抑制了冗余特征,强化了有效特征.在加权变换后的特征空间中进行聚类,实验结果表明,该算法优于sIB算法.  相似文献   

13.
针对隐含狄利克雷分布(LDA)模型特征提取时忽略语义信息的问题,提出一种融合LDA和全局文本表示(GloVe)模型的病症文本聚类算法LG&K-Medoide.首先,利用LDA对病症文本数据建模,采用JS(Jensen-Shannon)距离计算文本相似度;其次,利用GloVe对病症文本数据建模获取词向量,根据病症词性贡献...  相似文献   

14.
在特征选择领域,现有的大多数方法不能同时捕获不同特征有差异的权重,?不能对投影子空间施加正交约束来提高特征的判别力.为此,?本文提出联合图嵌入与特征加权的无监督特征选择方法(Joint?Graph?Embedding?and?Feature Weighting,?JGEFW).首先,?通过图嵌入局部结构学习获得相似度矩...  相似文献   

15.
未确知均值聚类   总被引:2,自引:0,他引:2  
利用未确知系统理论分析特征对样本分类所作贡献,定义特征的分类权重,并作为启发性知识用于确定样本与各类间的加权距离及样本属于各类的隶属度,建立未确知均值聚类算法。IRIS数据检验表明,未确知均值聚类算法误判样本数少、收敛速度快、鲁棒性好,是一种实用、有效的无监督聚类算法。  相似文献   

16.
聚类分析是数据挖掘中一项重要的技术,通过对多维用户行为的聚类分析,可以从用户层面来帮助管理人员得到更为精确和有效的用户评价信息。该文首先从用户行为数据中提取多维用户行为特征,之后采用基于互信息的无监督特征选择(UFS-MI)模型对提取的特征进行排序、筛选并确定权重,得到每个用户行为的加权特征向量。根据用户行为之间的相似性构造网络,然后通过Blondel社团划分算法对用户行为网络进行聚类分析。在某公交线路的实证数据集上的实验结果表明,该方法的准确率为92%,比传统聚类算法K-means的准确率有明显提升,研究结果可以为公交公司的管理层在进行统一管理和培训时提供参考。本文的工作拓展了网络科学在多维用户行为数据聚类分析的应用范围,丰富了多维驾驶行为数据聚类分析的思路,为决策者提供参考依据。  相似文献   

17.

原始在线加权的多示例学习跟踪假设每个示例是独立且在包中的贡献均相同, 同时为所有正样本赋予相同的权重,这不符合“包中的示例与目标位置的远近,对目标贡献程度是不一样”的事实. 再加上原始算法采取单一特征无法准确和全面地表示目标包中所包含的示例,从而影响了跟踪算法的鲁棒性. 针对原始算法的这些问题,提出一种基于带权重多样例学习的视觉跟踪方法. 该方法同时融合多特征(HOG特征和Haar特征),在多示例学习框架下同时训练分类器,并通过样本特征相似度的比较来赋予不同的权重. 对不同场景的图像序列进行实验,通过在公共测试集上与多种主流算法做对比,显示这样得到的目标外表模型对于前景和背景具有更高的区分能力. 结果表明:该算法具有更高的准确性和更强的适应性,可以有效克服传统多示例学习中的分类器退化问题.

  相似文献   

18.
原始在线加权的多示例学习跟踪假设每个示例是独立且在包中的贡献均相同,同时为所有正样本赋予相同的权重,这不符合"包中的示例与目标位置的远近,对目标贡献程度是不一样"的事实.再加上原始算法采取单一特征无法准确和全面地表示目标包中所包含的示例,从而影响了跟踪算法的鲁棒性.针对原始算法的这些问题,提出一种基于带权重多样例学习的视觉跟踪方法.该方法同时融合多特征(HOG特征和Haar特征),在多示例学习框架下同时训练分类器,并通过样本特征相似度的比较来赋予不同的权重.对不同场景的图像序列进行实验,通过在公共测试集上与多种主流算法做对比,显示这样得到的目标外表模型对于前景和背景具有更高的区分能力.结果表明:该算法具有更高的准确性和更强的适应性,可以有效克服传统多示例学习中的分类器退化问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号