期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陆林花《计算机仿真》2009,26(7):122-125,158

为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类. 相似文献

2.

基于模糊最近邻的高维数据聚类 总被引：3，自引：0，他引：3

刘纪平汪宏斌汪诚波周洞汝《小型微型计算机系统》2005,26(2):261-263

提出一种基于模糊最近邻的聚类算法(简称FNNC算法)．FNNC算法通过加权共享最近邻图来形成簇，而且仅仅使用对象图中一些有用的连接．本文通过实验验证了FNNC算法在高维数据聚类中的有效性．相似文献

3.

自然反向最近邻优化的密度峰值聚类算法

刘娟万静《计算机科学与探索》2021,15(10):1888-1899

密度峰值聚类算法是一种基于密度的聚类算法.针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构.首先,该算法引入反向最近邻计算数据对象的局部密度;其次,通过代表点和密度相结合的方式选取初始聚类中心;然后,应用密度自适应距离计算初始聚类中心之间的距离,利用基于反向最近邻计算出的局部密度和密度自适应距离在初始聚类中心上构建决策图,并通过决策图选择最终的聚类中心;最后,将剩余的数据对象分配到距离其最近的初始聚类中心所在的簇中.实验结果表明,该算法在合成数据集和UCI真实数据集上与实验对比算法相比较,具有较好的聚类效果和准确性,并且在处理复杂流形数据上的优越性较强. 相似文献

4.

大数据下的快速kNN分类算法_*

苏毅娟邓振云程德波宗鸣《计算机应用研究》2016,33(4)

针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KNN分类算法。该算法创新的在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测试过程中找出与待测样本距离最近的块,并将其作为新的训练样本进行K最近邻分类。这样的过程大幅度的减少了K最近邻算法的测试开销,使其能在大数据集中得以应用。实验表明,本文算法在与经典KNN分类准确率保持近似的情况下,分类的速度明显快于经典KNN算法。相似文献

5.

基于k-最近邻图的小样本KNN分类算法 总被引：1，自引：0，他引：1

下载免费PDF全文

刘应东牛惠民《计算机工程》2011,37(9):198-200

提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。相似文献

6.

基于共享最近邻的离群检测算法

苏晓珂郑远攀万仁霞《计算机应用研究》2012,29(7):2426-2428

为识别混合属性数据集中的离群点,提出了一种基于共享最近邻的离群检测算法,通过计算增量聚类结果簇间的共享最近邻相似度,不但能够发现任意形状的簇,还可以检测到变密度数据集中的全局离群点。算法时间复杂度关于数据集的大小和属性个数呈近似线性。在人工数据集和真实数据集上的实验结果显示,提出的算法能有效检测到数据集中的离群点。相似文献

7.

改进的最小生成树自适应分层聚类算法

徐晨凯高茂庭《计算机工程与应用》2014,50(22):149-153

针对传统最小生成树聚类算法需要事先知道聚类数目和使用静态全局分类依据,导致聚类密度相差较大时,算法有效性下降,计算复杂度大等问题,提出一种改进的最小生成树自适应分层聚类算法,根据最近邻关系,自动为每个聚类簇设定独立的阈值,使之适应分布密度相差较大的情况,并能自动确定聚类数目。实验表明,算法具有较好的性能,尤其对数据密度分布不均匀的情况也能得到较好的聚类结果。相似文献

8.

改进的共享最近邻聚类算法

下载免费PDF全文

李霞蒋盛益《计算机工程与应用》2011,47(8):138-142

聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法（SNN）在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足：（1）时间复杂度为O（n2）,不适合处理大规模数据集;（2）没有明确给出参数阈值的简单指导性操作方法;（3）只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。相似文献

9.

基于K-Medoids聚类的改进KNN文本分类算法

罗贤锋祝胜林陈泽健袁玉强《计算机工程与设计》2014,(11):3864-3867,3937

为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。相似文献

10.

基于遗传进化的最近邻聚类算法及其应用 总被引：4，自引：0，他引：4

下载免费PDF全文

陈真勇何永勇褚福磊黄靖远《控制与决策》2002,17(4):469-472

提出了基于遗传进化的最近邻聚类算法，该算法结合了遗传算法（GA）与最近邻聚类算法（NN）。对要进行分类的样本和特征量进行优化选取，去除位于类交界的模糊样本，并对样本分类有效的特征量进行放大，对不利于样本分类的特征量进行抑制，从而提高了样本分类的精度，将该算法应用于抽水蓄能发电机组的工况分类，大大提高了机组工况的识别效果，验证了基于遗传算法的最近邻聚类算法的有效性。相似文献