首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 125 毫秒

1.  基于近邻传播算法的最佳聚类数确定方法比较研究  被引次数:1
   周世兵  徐振源  唐旭清《计算机科学》,2011年第38卷第2期
   在聚类分析中,决定聚类质量的关键是确定最佳聚类数。提出采用聚类效果较好的近部传播聚类算法对样本进行聚类,运用6种聚类有效性指标分别对聚类结果进行有效性分析,以确定最佳聚类数。具体分析了这些有效性指标,并改进了IGP指标确定最佳聚类数的方法。针对8个数据集,通过实验比较这些指标的性能。分析和实验结果表明,基于近部传播聚类算法,IGP指标确定最佳聚类数的性能最好。    

2.  一种基于多示例学习的动态样本集半监督聚类算法  
   李学贵  许少华  李娜  于文韬《化工自动化及仪表》,2016年第11期
   针对时域空间动态样本模式分类和标记信息的有效利用问题,提出了一种基于多示例学习的动态样本半监督聚类算法。根据时间信号的结构关系和模态特征,建立动态样本的多示例信息表示模型;通过定义一种可度量时变函数样本包间近似度的广义Hausdorff距离和基于近邻传播的聚类原则,构建多示例动态样本包的半监督聚类算法。算法利用样本包的类别先验知识构建样本集初始划分种子簇并探索样本的分布特征,采用基于广义Hausdorff距离的近邻传播策略调整样本包聚类,突出动态指标局部模态变化特征在样本分类中的差异性。以油田地质研究中测井曲线油层水淹状况判别为例,验证了模型和算法的有效性。    

3.  K-means算法最佳聚类数确定方法  被引次数:7
   周世兵  徐振源  唐旭清《计算机应用》,2010年第30卷第8期
   K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定.从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法.理论研究和实验结果验证了以上算法方案的有效性和良好性能.    

4.  基于区间数的不确定数据流2k近邻聚类算法  
   陆亿红  任胜亮《浙江工业大学学报》,2018年第3期
   现有数据流聚类算法多数面向的是确定性数据,可是不确定数据的数据流聚类逐步被受到关注,因为经典的不确定数据聚类算法具有概率密度函数获取困难、实用性不强以及计算复杂等缺点,提出一种基于区间数的不确定数据流聚类算法UIDStream.算法用区间数来表示属性不确定性数据和基于区间数的距离计算方法,定义了不确定性数据之间的相似度,并利用传统k近邻聚类的思想,提出基于区间数的2k近邻微簇和最优2k近邻微簇的概念,通过最优2k近邻微簇的融合,实现不确定数据流的聚类.实验结果表明:改进后的算法具有良好的聚类效果,提高了不确定数据流聚类的聚类质量和速率.    

5.  新的K-均值算法最佳聚类数确定方法  被引次数:6
   周世兵  徐振源  唐旭清《计算机工程与应用》,2010年第46卷第16期
   K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。    

6.  基于互近邻一致性的近邻传播算法  
         《计算机应用研究》,2012年第29卷第7期
   近邻传播(AP)算法是一种新提出的聚类算法,是在数据点的相似度矩阵的基础上进行聚类,通过数据点之间交换信息,最后得到聚类结果。提出了基于互近邻一致性近邻传播算法,即KMNC-AP算法,该算法利用互近邻一致性调整数据点之间的相似度,进而提高聚类效率和精确度。实验结果表明,该算法在处理能力和运算速度上优于原算法。    

7.  基于时间序列的AP-NN混合模型聚类  
   林海娟  陈晓云《计算机工程与应用》,2014年第2期
   仿射传播算法是一种快速有效的聚类方法,但其聚类结果的不稳定性影响了聚类性能。对此,提出基于近邻的仿射传播算法(AP-NN),通过仿射传播算法产生初始簇,并从中选择代表簇对非代表簇的样本进行近邻聚类。在时间序列数据集上的实验结果表明,AP-NN模型算法能够产生较好的聚类结果,适用于聚类分析。    

8.  面向大规模数据集的近邻传播聚类  被引次数:1
   谷瑞军  汪加才  陈耿  陈圣磊《计算机工程》,2010年第36卷第23期
   近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用。为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分。实验结果表明,该算法在处理能力和运算速度上优于原算法。    

9.  基于密度调整和流形距离的近邻传播算法  
   夏春梦  倪志伟  倪丽萍  张霖《计算机科学》,2017年第44卷第10期
   针对近邻传播聚类算法在构造相似度矩阵时因对多重尺度和任意形状数据敏感而聚类效果不理想的缺陷,提出一种基于密度调整和流形距离的近邻传播算法。该算法将“领域密度”和“流形理论”的思想引入近邻传播算法,利用基于密度调整和流形的距离更好地刻画了样本空间的真实分布状况,解决了相似度矩阵不能充分表示数据之间内在关系的问题,在一定程度上提高了近邻传播聚类算法的聚类效果。通过在人工数据集和标准数据集上进行实验对比,验证了算法的有效性和优越性。    

10.  一种改进的基于局部密度的聚类算法  
   关晓惠  钱亚冠  孙欣欣《电信科学》,2016年第1期
   聚类分析一直是机器学习和数据挖掘领域一个比较活跃而且极具挑战性的研究方向.Alex提出的基于局部密度的聚类算法是一种快速、有效的聚类方法,但该方法通过手工选取确定聚类个数和聚类中心.为此,对原算法进行改进,在初步选取候选聚类中心的基础上,使用基于密度连通的算法优化选取聚类中心,然后使用大密度最近邻方法确定样本类别.实验证明,该方法能有效解决聚类个数和聚类中心无法确定的问题,同时在聚类评价指标上显示出较好的聚类效果和性能.    

11.  汽轮机故障诊断的粒子群优化加权模糊聚类法  
   陈平  张钧  鞠萍华  任铮《振动、测试与诊断》,2011年第31卷第5期
   针对模糊C-均值算法在汽轮机故障诊断中的不足,提出了粒子群优化加权模糊聚类分析的方法.首先,采用基于样本相似度的特征加权方法对样本特征及样本进行加权,以适应各种复杂分布的样本;然后,利用粒子群算法优化加权模糊聚类的特征权值和聚类目标函数,并依据聚类有效性指标自适应确定最佳聚类数及聚类结果.试验结果表明,该方法具有收敛速度快和全局收敛的特点,有效降低了汽轮机故障诊断的误分类率,诊断结果可靠.    

12.  密度不敏感的近邻传播聚类算法研究  
   冯晓磊  于洪涛《计算机工程》,2012年第38卷第2期
   近邻传播算法在非凸形、密度不均匀的数据集上很难得到理想的聚类结果。为此,基于核聚类的思想,将数据集非线性地映射到高维空间,使数据集更加分离。利用共享最近邻的相似度度量方法,提出一种密度不敏感的近邻传播算法DIS-AP,以弥补原算法易受特征集维数和密度影响的缺点,从而有效解决数据集非凸和密度不均匀问题,拓宽算法的应用范围。仿真实验结果证明,DIS-AP算法具有更好的聚类性能。    

13.  基于模糊聚类的改进LLE算法  
   苏锦旗  张文宇《计算机与现代化》,2014年第5期
   局部线性嵌入法(Locally Linear Embedding,LLE)是一种基于流形学习的非线性降维方法。针对LLE近邻点个数选取、样本点分布以及计算速度的问题,提出基于模糊聚类的改进LLE算法。算法根据聚类中心含有大量的信息这一特点,基于模糊聚类原理,采用改进的样本点距离计算方法,定义了近似重构系数,提高了LLE计算速度,改进了模糊近邻点个数的选取。实验结果表明,改进的算法有效地降低了近邻点个数对算法的影响,具有更好的降维效果和更高的计算速度。    

14.  基于强类别特征近邻传播的半监督文本聚类  
   《模式识别与人工智能》,2014年第7期
   为处理高维稀疏的大规模文档数据,提出一种基于强类别特征近邻传播(SCFAP)的半监督文本聚类算法.聚类过程中,利用少量带类别标签的监督数据,提取具有强类别区分能力的特征项以构建更有效的样本间相似性测度.并在每轮迭代完成后将类别确定性程度最高的未标记样本转移到已标注集,使算法执行效率提高.实验结果表明,这种改进对于近邻传播算法的性能和准确度的提升有较大帮助,在Reuter-21578和20Newsgroups两个相异数据集上,SCFAP算法表现较好的适用性.综合考察聚类微平均Fμ指标和类簇纯度Pt指标,该算法在少量监督信息辅助下能快速获得较好的聚类结果.    

15.  基于改进LDA和CNN的网络入侵聚类  
   谭立志  李二喜  欧阳艾嘉  贺明华  周旭《计算机工程与应用》,2013年第49卷第2期
   提出了一种基于改进线性判别分析和近邻法的网络入侵聚类方法,运用改进的线性判别分析方法对网络入侵样本特征进行降维处理,使用近邻分类器对数据进行聚类。该算法降低了算法的聚类时间,还提高了算法的聚类能力。实验结果表明,相比其他模型,该算法有较高的检测率和较低的误警率。    

16.  密度敏感的层次化聚类算法研究  
   卢鹏丽  王祖东《计算机工程与应用》,2014年第4期
   以密度敏感距离作为相似性测度,结合近邻传播聚类算法和谱聚类算法,提出了一种密度敏感的层次化聚类算法。算法以密度敏感距离为相似度,多次应用近邻传播算法在数据集中选取一些“可能的类代表点”;用谱聚类算法将“可能的类代表点”再聚类得到“最终的类代表点”;每个数据点根据其类代表点的类标签信息找到自己的类标签。实验结果表明,该算法在处理时间、内存占用率和聚类错误率上都优于传统的近邻传播算法和谱聚类算法。    

17.  GPU加速的自适应仿射传播聚类方法  
   陈艳阳  曾卫明《计算机系统应用》,2016年第25卷第11期
   自适应仿射传播聚类作为一种新兴的聚类算法,不需要指定初始类心以及类数,对解决聚类中类数不确定性问题非常有效.然而,自适应仿射传播聚类存在时间消耗过大的问题,当样本数量较大时运行速度缓慢.为了提高自适应仿射传播聚类的运行速度,基于NVIDIA公司的统一计算设备架构(Compute Unified Device Architecture,CUDA)和Matlab并行工具箱,提出了一种自适应仿射传播聚类的并行化方法.实验结果表明,基于GPU并行化的自适应仿射传播聚类在运行速度上有了明显提高,与该算法的串行执行方式相比,运行速度提升2倍以上,并且随着样本数量的增长,加速性能越来越好.    

18.  基于维度属性距离的混合属性近邻传播聚类算法  
   黄德才  钱潮恺《计算机科学》,2015年第42卷第Z11期
   针对近邻传播聚类算法不能处理混合属性数据集的问题,提出了一种新的距离度量测度,并将其应用到近邻传播聚类算法中,提出了一种基于维度属性距离的混合属性近邻传播聚类算法。与传统聚类算法不同的是,该算法不需要计算虚拟的中心点,同时考虑了数据集整体分布对聚类结果的影响。将算法在UCI数据库的2个混合属性数据集上进行验证,同时对比了经典的K-Prototypes算法以及K-Modes算法。实验结果表明,改进后的算法具有更好的聚类质量以及执行效率,算法的优越性得到了验证。    

19.  基于改进的SOM聚类连续属性离散化算法  
   陶刚  闫永刚  刘俊  邹娇《计算机应用》,2015年第Z1期
   为解决连续属性值的离散化问题,提出了一种改进的自组织映射( SOM )聚类离散化算法,该算法利用SOM实现初始聚类,界定聚类上限;之后以初始聚类中心为样本,通过层次方法的平衡迭代规约和聚类( BIRCH)层次聚类算法进行二次聚类,解决聚类数虚高问题并确定离散断点集;最后对断点集任一样本找出其所在维各聚类中心的最近邻,以此作为离散微调依据。实验结果表明,该算法在断点集数(轮廓系数提升75%)及离散精度方面(不相容度更近似0)均优于传统SOM聚类离散化算法,可有效解决大样本、高维数据离散化问题。    

20.  基于合并思想和竞争学习思想的聚类新算法  被引次数:2
   段敏  张锡恩《计算机工程与设计》,2006年第27卷第9期
   针对分类目的准确标识出有样本分布的空间区域位置,没有类分布先验知识,类数不能预先确定的情况,提出一种聚类新方法.该算法的初始类心为所有样本点,竞争获胜规则由最近邻改为阈值,竞争过程中同时进行类心合并.在样本数量较大时,提出网格中心法和网格采样法降低计算复杂度.实验结果证实该算法对初始设置和参数不敏感,且结束条件容易确定,在一定程度上聚类效果优于其它算法.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号