共查询到20条相似文献,搜索用时 46 毫秒
1.
自适应仿射传播聚类 总被引:42,自引:4,他引:42
适合处理大类数的仿射传播聚类有两个尚未解决的问题: 一是很难确定偏向参数取何值能够使算法产生最优的聚类结果; 另一个是当震荡发生后算法不能自动消除震荡并收敛. 为了解决这两个问题, 提出了自适应仿射传播聚类方法, 具体技术包括: 自适应扫描偏向参数空间来搜索聚类个数空间以寻找最优聚类结果、自适应调整阻尼因子来消除震荡以及当调整阻尼因子方法失效时的自适应逃离震荡技术. 与原算法相比, 自适应仿射传播聚类方法性能更优, 能够自动消除震荡和寻找最优聚类结果. 对模拟和真实数据集的实验结果表明, 自适应仿射传播聚类方法十分有效, 其聚类质量优于或不低于原算法. 相似文献
2.
针对Science杂志上提出的仿射传播(Affinity propagation)聚类产生指定类数的聚类结果时效率较低的问题,提出了基于多网格策略的快速算法。该算法采用多网格搜索策略来减少调用仿射传播算法的次数,改进偏向参数的上界以缩小搜索范围。新方法大幅度地提高了仿射传播聚类在指定类数下的速度性能。实验结果表明新方法十分有效,在运行时间上比现有方法减少了22%-90%。 相似文献
3.
指定类数下仿射传播聚类的快速算法① 总被引:1,自引:0,他引:1
针对Science杂志上提出的仿射传播(Affinity propagation)聚类产生指定类数的聚类结果时效率较低的问题,提出了基于多网格策略的快速算法。该算法采用多网格搜索策略来减少调用仿射传播算法的次数,改进偏向参数的上界以缩小搜索范围。新方法大幅度地提高了仿射传播聚类在指定类数下的速度性能。实验结果表明新方法十分有效,在运行时间上比现有方法减少了22%-90%。 相似文献
4.
5.
对于手写字符识别过程中相似字符较多且相同字符存在大量不规则书写变形的问题,提出一种改进的仿射传播聚类算法加入手写字符识别过程中。该算法基于原始仿射传播(AP)聚类算法,将其与聚类评判函数Silhouette结合,通过AP算法迭代过程自适应地改变偏向参数以调整类别数,并且结合每次聚类质量得到最优聚类结果。基于手写汉字识别的实验结果表明,加入了原始AP算法的识别率比传统识别过程得到的识别率总体提高1.52%,而加入改进AP算法的识别率又比加入原始AP算法的识别率总体提高了1.28%。该实验结果验证了加入聚类算法于手写字符识别过程的有效性,而改进AP算法相比原始AP算法在收敛性和聚类质量上都有一定的提高。 相似文献
6.
自适应仿射传播聚类作为一种新兴的聚类算法,不需要指定初始类心以及类数,对解决聚类中类数不确定性问题非常有效.然而,自适应仿射传播聚类存在时间消耗过大的问题,当样本数量较大时运行速度缓慢.为了提高自适应仿射传播聚类的运行速度,基于NVIDIA公司的统一计算设备架构(Compute Unified Device Architecture,CUDA)和Matlab并行工具箱,提出了一种自适应仿射传播聚类的并行化方法.实验结果表明,基于GPU并行化的自适应仿射传播聚类在运行速度上有了明显提高,与该算法的串行执行方式相比,运行速度提升2倍以上,并且随着样本数量的增长,加速性能越来越好. 相似文献
7.
仿射传播聚类是一种快速有效的聚类方法。但对高维数据进行聚类时,由于数据信息的重叠,聚类结果往往会有较大误差。针对这个问题,提出了把主元分析(PCA)和仿射传播(AP)聚类相结合的PCA-AP算法,在保留原变量绝大部分信息的情况下对数据进行降维处理,然后在低维空间中用仿射传播聚类的方法进行聚类。由于剔除了冗余信息,算法得到的分类结果更加准确。实验结果表明该算法是有效的。 相似文献
8.
仿射传播算法是一种快速有效的聚类方法,但其聚类结果的不稳定性影响了聚类性能。对此,提出基于近邻的仿射传播算法(AP-NN),通过仿射传播算法产生初始簇,并从中选择代表簇对非代表簇的样本进行近邻聚类。在时间序列数据集上的实验结果表明,AP-NN模型算法能够产生较好的聚类结果,适用于聚类分析。 相似文献
9.
10.
对舰船三维模型进行视点空间均匀投影,投影图像存在信息冗余,聚类技术是消除冗余投影的方法之一.由于缺少舰船投影的聚类知识,为了避免聚类结果受限于初始类代表点选择的缺点,研究了仿射传播聚类算法,首先提取所有投影图像特征,然后将所有特征进行归一化处理并作为初始聚类中心,提出了用空间向量模型计算特征相似度的方法,合并相似特征对应的投影图像,最后用聚类中心特征表示舰船目标.为了进一步验证改进相似度聚类算法的聚类质量,进行了聚类有效性分析,实验表明改进算法聚类质量好于原算法. 相似文献
11.
文本聚类在文本挖掘和信息检索系统中发挥着重要的作用,而词聚类是文本聚类的基础。提出了一种基于混合聚类的中文词聚类方法,它将层次聚类和概念聚类结合起来,以缩短整个聚类时间。首先对预处理后的词集进行初始聚类,然后从每个类中各取一个出现次数最多的词组成新的词集,最后对该词集进行再聚类。实验表明,这种方法有效降低了中文词聚类的时间复杂度。 相似文献
12.
为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果. 相似文献
13.
模糊kohonen聚类神经网络将模糊隶属度概念应用于一般Kohonen聚类网络的学习和更新策略中,改善了Kohonen聚类网络的性能,是一种快速有效的聚类网络.但在死神经元的处理和收敛速度上还有改进的空间.为了能使网络更好应用于海量数据的聚类问题,对模糊Kohonen聚类网络算法在输出神经元的模糊偏置度、侧抑制模糊隶属度和加权系数提出了三方面改进.同时,对改进的模糊Kohonen聚类网络的有效性进行实例仿真,仿真结果体现了改进算法能有效避免死神经元的出现和提高了网络的聚类速度. 相似文献
14.
15.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。 相似文献
16.
17.
基于减法聚类与模糊c-均值的模糊聚类的研究 总被引:4,自引:0,他引:4
模糊c-均值算法在进行模糊聚类的时候对初始值非常的敏感,初始值设置得不好,就会陷入局部最优解。该文在使用模糊c-均值之前利用减法聚类对其设置初始值,不但能够获得最优解,还能加快收敛速度,并且自动获得最佳的聚类个数。 相似文献
18.
19.