期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

自适应仿射传播聚类 总被引：42，自引：4，他引：42

王开军张军英李丹张新娜郭涛《自动化学报》2007,33(12):1242-1246

适合处理大类数的仿射传播聚类有两个尚未解决的问题: 一是很难确定偏向参数取何值能够使算法产生最优的聚类结果; 另一个是当震荡发生后算法不能自动消除震荡并收敛. 为了解决这两个问题, 提出了自适应仿射传播聚类方法, 具体技术包括: 自适应扫描偏向参数空间来搜索聚类个数空间以寻找最优聚类结果、自适应调整阻尼因子来消除震荡以及当调整阻尼因子方法失效时的自适应逃离震荡技术. 与原算法相比, 自适应仿射传播聚类方法性能更优, 能够自动消除震荡和寻找最优聚类结果. 对模拟和真实数据集的实验结果表明, 自适应仿射传播聚类方法十分有效, 其聚类质量优于或不低于原算法. 相似文献

2.

指定类数下仿射传播聚类的快速算法①

王开军郑捷《计算机系统应用》2010,19(5):207-209

针对Science杂志上提出的仿射传播（Affinity propagation）聚类产生指定类数的聚类结果时效率较低的问题,提出了基于多网格策略的快速算法。该算法采用多网格搜索策略来减少调用仿射传播算法的次数,改进偏向参数的上界以缩小搜索范围。新方法大幅度地提高了仿射传播聚类在指定类数下的速度性能。实验结果表明新方法十分有效,在运行时间上比现有方法减少了22%－90%。相似文献

3.

指定类数下仿射传播聚类的快速算法① 总被引：1，自引：0，他引：1

王开军郑捷《计算机系统应用》2010,19(7):207-209

针对Science杂志上提出的仿射传播（Affinity propagation）聚类产生指定类数的聚类结果时效率较低的问题,提出了基于多网格策略的快速算法。该算法采用多网格搜索策略来减少调用仿射传播算法的次数,改进偏向参数的上界以缩小搜索范围。新方法大幅度地提高了仿射传播聚类在指定类数下的速度性能。实验结果表明新方法十分有效,在运行时间上比现有方法减少了22％-90％。相似文献

4.

半监督的仿射传播聚类 总被引：4，自引：0，他引：4

下载免费PDF全文

王开军李健张军英涂重阳《计算机工程》2007,33(23):197-198

仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。相似文献

5.

基于仿射传播聚类的自适应手写字符识别

杨怡王江晴朱宗晓《计算机应用》2015,35(3):807-810

对于手写字符识别过程中相似字符较多且相同字符存在大量不规则书写变形的问题,提出一种改进的仿射传播聚类算法加入手写字符识别过程中。该算法基于原始仿射传播(AP)聚类算法,将其与聚类评判函数Silhouette结合,通过AP算法迭代过程自适应地改变偏向参数以调整类别数,并且结合每次聚类质量得到最优聚类结果。基于手写汉字识别的实验结果表明,加入了原始AP算法的识别率比传统识别过程得到的识别率总体提高1.52%,而加入改进AP算法的识别率又比加入原始AP算法的识别率总体提高了1.28%。该实验结果验证了加入聚类算法于手写字符识别过程的有效性,而改进AP算法相比原始AP算法在收敛性和聚类质量上都有一定的提高。相似文献

6.

GPU加速的自适应仿射传播聚类方法

陈艳阳曾卫明《计算机系统应用》2016,25(11):146-150

自适应仿射传播聚类作为一种新兴的聚类算法,不需要指定初始类心以及类数,对解决聚类中类数不确定性问题非常有效.然而,自适应仿射传播聚类存在时间消耗过大的问题,当样本数量较大时运行速度缓慢.为了提高自适应仿射传播聚类的运行速度,基于NVIDIA公司的统一计算设备架构（Compute Unified Device Architecture,CUDA）和Matlab并行工具箱,提出了一种自适应仿射传播聚类的并行化方法.实验结果表明,基于GPU并行化的自适应仿射传播聚类在运行速度上有了明显提高,与该算法的串行执行方式相比,运行速度提升2倍以上,并且随着样本数量的增长,加速性能越来越好. 相似文献

7.

基于PCA的仿射传播聚类算法

下载免费PDF全文

宋坤李丽娟赵英凯《计算机工程与应用》2011,47(34):212-214

仿射传播聚类是一种快速有效的聚类方法。但对高维数据进行聚类时,由于数据信息的重叠,聚类结果往往会有较大误差。针对这个问题,提出了把主元分析（PCA）和仿射传播（AP）聚类相结合的PCA-AP算法,在保留原变量绝大部分信息的情况下对数据进行降维处理,然后在低维空间中用仿射传播聚类的方法进行聚类。由于剔除了冗余信息,算法得到的分类结果更加准确。实验结果表明该算法是有效的。相似文献

8.

基于时间序列的AP-NN混合模型聚类

林海娟陈晓云《计算机工程与应用》2014,(2):152-155,174

仿射传播算法是一种快速有效的聚类方法,但其聚类结果的不稳定性影响了聚类性能。对此,提出基于近邻的仿射传播算法(AP-NN),通过仿射传播算法产生初始簇,并从中选择代表簇对非代表簇的样本进行近邻聚类。在时间序列数据集上的实验结果表明,AP-NN模型算法能够产生较好的聚类结果,适用于聚类分析。相似文献

9.

基于仿射传播的有向网络聚类算法

朱牧孟凡荣周勇《计算机应用研究》2013,30(7):1950-1952

现有大多数的网络聚类方法都只是针对无向网络, 已有的有向网络聚类方法建立在传统聚类算法基础之上, 存在着一定的局限性。针对上述问题, 提出一种基于仿射传播的有向网络聚类算法, 该算法首先采用SimRank作为节点之间的相似度, 并将计算得到的结果转换为适应于仿射传播算法的负值; 然后将相似度矩阵作为输入, 利用具有更好性能的仿射传播算法对有向网络进行聚类。实验结果表明, 所提出算法的聚类性能优于其他几种具有代表性的有向网络聚类算法。相似文献

10.

改进相似度的仿射传播聚类算法

于吉红白晓明吕俊伟《小型微型计算机系统》2013,34(3)

对舰船三维模型进行视点空间均匀投影,投影图像存在信息冗余,聚类技术是消除冗余投影的方法之一.由于缺少舰船投影的聚类知识,为了避免聚类结果受限于初始类代表点选择的缺点,研究了仿射传播聚类算法,首先提取所有投影图像特征,然后将所有特征进行归一化处理并作为初始聚类中心,提出了用空间向量模型计算特征相似度的方法,合并相似特征对应的投影图像,最后用聚类中心特征表示舰船目标.为了进一步验证改进相似度聚类算法的聚类质量,进行了聚类有效性分析,实验表明改进算法聚类质量好于原算法. 相似文献

11.

基于混合聚类的中文词聚类

史金成程转流《微计算机信息》2010,(15)

文本聚类在文本挖掘和信息检索系统中发挥着重要的作用,而词聚类是文本聚类的基础。提出了一种基于混合聚类的中文词聚类方法,它将层次聚类和概念聚类结合起来,以缩短整个聚类时间。首先对预处理后的词集进行初始聚类,然后从每个类中各取一个出现次数最多的词组成新的词集,最后对该词集进行再聚类。实验表明,这种方法有效降低了中文词聚类的时间复杂度。相似文献

12.

基于协同聚类的两阶段文本聚类方法

王明文付剑波罗远胜陆旭《模式识别与人工智能》2009,22(6)

为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果. 相似文献

13.

基于模糊kohonen聚类网络的改进算法

徐妙君谭小球《计算机仿真》2009,26(4)

模糊kohonen聚类神经网络将模糊隶属度概念应用于一般Kohonen聚类网络的学习和更新策略中,改善了Kohonen聚类网络的性能,是一种快速有效的聚类网络.但在死神经元的处理和收敛速度上还有改进的空间.为了能使网络更好应用于海量数据的聚类问题,对模糊Kohonen聚类网络算法在输出神经元的模糊偏置度、侧抑制模糊隶属度和加权系数提出了三方面改进.同时,对改进的模糊Kohonen聚类网络的有效性进行实例仿真,仿真结果体现了改进算法能有效避免死神经元的出现和提高了网络的聚类速度. 相似文献

14.

一种基于模糊核聚类的谱聚类算法

《计算机工程》2017,(11)

谱聚类是对样本拉普拉斯矩阵的特征向量进行聚类,不局限于原始数据的分布形状,可收敛于全局最优解,但不能准确反映样本间的实际关系,而模糊核聚类可利用模糊数学理论确定样本间的模糊关系。为此,在调整相似度度量函数和距离度量函数的基础上,将模糊核聚类融合到谱聚类算法中,提出SC-KFCM算法,利用模糊划分改进谱聚类中的硬划分,根据特征向量间的相似性和关联程度建立模糊隶属关系并对样本进行聚类,从而弥补谱聚类中硬划分部分对聚类结果造成的影响。实验结果表明,SC-KFCM算法在不同分布特点及维数的数据集上均取得了较稳定的聚类结果和较高的聚类精度。相似文献

15.

基于改进K均值聚类算法的星点聚类研究

下载免费PDF全文

夏永泉孙静茹 WUXin-wen 支俊王兵谢希望《图学学报》2019,40(2):358

针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题：①天文图像的分辨率较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。相似文献

16.

基于k最相似聚类的子空间聚类算法 总被引：1，自引：2，他引：1

下载免费PDF全文

单世民闫妍张宪超《计算机工程》2009,35(14):4-6

子空间聚类是聚类研究领域的一个重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚类算法。该算法使用一种聚类间相似度度量方法保留k最相似聚类,在不同子空间上采用不同局部密度阈值,通过k最相似聚类确定子空间搜索方向。将处理的数据类型扩展到连续型和分类型,可以有效处理高维数据聚类问题。实验结果证明,与CLIQUE和SUBCLU相比,该算法具有更好的聚类效果。相似文献

17.

基于减法聚类与模糊c-均值的模糊聚类的研究 总被引：4，自引：0，他引：4

肖春景张敏《计算机工程》2005,31(Z1):135-137

模糊c-均值算法在进行模糊聚类的时候对初始值非常的敏感,初始值设置得不好,就会陷入局部最优解。该文在使用模糊c-均值之前利用减法聚类对其设置初始值,不但能够获得最优解,还能加快收敛速度,并且自动获得最佳的聚类个数。相似文献

18.

基于减法聚类的合并最优路径层次聚类算法

朱琪张会福杨宇波杨泉清《计算机工程》2015,(6)

针对传统层次聚类算法在处理大规模数据时效率低下的问题,提出一种快速层次聚类算法。根据数据点密度值的大小依次确定初始聚类中心,使用最小生成树算法对初始聚类中心间的相似度距离进行存储,寻找最优合并路径,从而减少更新距离矩阵的计算量和空间复杂度,并优化减法聚类中的收敛函数。在UCI数据集上的实验结果表明,该算法比传统聚类算法执行速度更快、效率更高,且随着数据量的增多,在时间消耗方面的优势更明显。相似文献

19.

基于自组织聚类及自决定聚首的路由算法

下载免费PDF全文

李照奎石祥滨王岩《计算机工程》2010,36(7):93-95,9

针对结构化对等网系统的拓扑失配问题,提出一种基于自组织聚类及自决定聚首的路由算法。该算法为每个节点设置不同的聚类邻居集,每个节点根据自己的能力决定是否成为自己邻居集的聚首。节点资源的查找按照自身邻居集查找、聚首邻居集查找及常规算法查找3步进行。实验结果表明,改进后算法具有较高的路由查找成功率,可较好地解决拓扑失配问题。相似文献

20.

基于聚类特性的大规模文本聚类算法研究 总被引：3，自引：0，他引：3

唐春生金以慧《计算机科学》2002,29(9):13-15

一、引言随着Internet的飞速发展,人们能从网上得到更多的信息,但过多的信息常常会导致信息迷失。将信息进行分类是帮助信息利用的有效方法,聚类则是文本类别划分时常用的技术,其特点是不需训练集即可从给定的文本集合中找到聚类划分。已有的聚类方法大多是针对小规模数据的,当计算资源和时间受到限制时,原有的大部分方法已不能满足要求,需要能够处理大规模数据的算法。标准k均值方法是比较基本也是很常用的一种聚类方法,其计算复杂度与模式数量成线性关系,这使其具有处理大规模数据的可能。k均值方法本质上是一种选代的方法,当数据不能一次全部读入内存时,则需和磁盘进行多次数据交换,并且这种交换相应于迭代次数要反复多次,这无疑需要花费大量的I/O时间。相似文献