共查询到20条相似文献,搜索用时 62 毫秒
1.
通过学习数据集的低维流形结构,给出一种流形距离测度;结合成对约束信息,调整数据的相似度矩阵,将其作为近邻传播算法的输入,提出了基于流形距离的半监督近邻传播聚类算法(SAP-MD)。通过在UCI标准数据集上的仿真实验表明,SAP-MD算法相比于仅利用成对约束信息的聚类算法,在聚类性能上有很大提高。 相似文献
2.
将一种新的流形距离作为相似性度量测度, 提出了一种用于无监督分类与识别的人工免疫系统方法. 通过基于流形距离的相似性度量, 有效利用样本集固有的全局一致性信息, 充分挖掘无类属样本的空间分布信息, 对样本进行类别划分. 新方法将免疫响应过程建模为一个四元组 AIR=(G,I,R,A) , 其中 G 为引发免疫响应的外界刺激, 即抗原; I 为所有可能抗体的集合; R 为抗体间相互作用的规则集合; A 为支配抗体反应、指导抗体进化的动态算法. 针对无监督分类问题, 将抗体编码为代表各类别的典型样本序号的排列, 利用动态算法 A 搜索能代表各类别的典型样本的最佳组合. 将新方法与标准的 K-均值算法、基于流形距离的进化聚类算法以及 Maulik 等人提出的基于遗传算法的聚类算法进行了性能比较. 对 6 个人工数据集及手写体数字识别问题的仿真实验结果显示, 新方法对样本空间分布复杂的无监督分类问题和实际的模式识别问题具有较高的准确率和较好的鲁棒性. 相似文献
3.
数据集的聚类边界不清晰时,人工免疫网络聚类使用最小生成树确定聚类数的依据往往不足.分析了问题存在的原因,提出一种基于人工免疫网络的半监督聚类算法.该算法一方面在抗体克隆操作中嵌入数据集 的先验信息,抑制位于聚类边界区域抗体的激活能力,从而保证记忆网络能更清晰的反映数据集中各聚类原型的结构;另一方面,将先验信息用于... 相似文献
4.
大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性. 相似文献
5.
传统的基于免疫的入侵检测系统需要足够的标记数据才能够生成具有良好泛化性能的抗体,而网络环境中获得充足的标记数据是困难的。为克服这一难题,对无监督聚类技术及免疫方法进行深入研究,并将二者结合起来,提出一种半监督的免疫入侵检测算法SCIID(Semi-supervised cluster based Immune Intrusion Detection)。在抗体产生阶段通过对自我样本进行聚类,大大缩短了阴性选择的时间;在入侵检测阶段采用聚类技术可快速获取未标记数据的类别,进而指导后续的学习过程,达到提高检测率的目的。仿真结果表明,该算法在仅有少量标记数据的情况下,可以获得大部分未标记数据的类别,而且能发现新的攻击类型,同等训练样例数目条件下检测率高于单纯基于免疫的方法。 相似文献
6.
7.
一种基于人工免疫系统的聚类算法 总被引:8,自引:2,他引:8
该文根据数据分析中聚类判断所遵循的原则,模拟抗体捕获抗原的机制,提出了一种基于人工免疫系统的聚类算法。该方法最终可以获得全局最优解,并且具有本质上的并行性、计算效率高、聚类能力强等优点。 相似文献
8.
一种基于人工免疫系统的聚类算法 总被引:1,自引:2,他引:1
根据数据分析中聚类判断所遵循的原则,模拟抗体捕获抗原的机制,提出了一种基于人工免疫系统的聚类算法,最终可以获得全局最优解,并且具有本质上的并行性、计算效率高和聚类能力强等优点。 相似文献
9.
通过融合图像中不同模态的信息并利用少量带标记的图像进行半监督距离学习,来对图像进行聚类。首先,提取彩色图像中RGB颜色空间的直方图信息、纹理信息,并采用SIFT算法提取Bag of Words来重新表达图像,从而基于图像的颜色特征、纹理特征以及语义特征,建立图像的多模态表达机制,将原始图像投射到表达空间;然后,利用少量标记的图像,通过半监督距离学习,获得图像在多模态信息空间的相似性度量;最后,通过半监督聚类方法,实现图像分组,在多个图像数据库中验证提出的方法的有效性。 相似文献
10.
一种基于谱聚类的半监督聚类方法 总被引:6,自引:1,他引:6
半监督聚类利用少部分标签的数据辅助大量未标签的数据进行非监督的学习,从而提高聚类的性能。提出一种基于谱聚类的半监督聚类算法,其利用标签数据的信息,调整点与点之间的距离所形成的距离矩阵,而后基于被调整的距离矩阵进行谱聚类。实验表明,该算法较之于已提出的半监督聚类算法,获得了更好的聚类性能。 相似文献
11.
12.
13.
14.
15.
本文构造了一种能准确描述文本之间相似性(亲和力)的新方法,并在此基础上提出了一种基于人工免疫网络的文本聚类算法。仿真结果表明,与传统的文本聚类算法相比,新算法不仅能自动发现新类,而且具有聚类精度更高、数据压缩比更大、与输入初始配置无关、可增量处理的优势。 相似文献
16.
一种基于人工免疫原理的混合聚类算法 总被引:1,自引:0,他引:1
通过借鉴生物免疫系统中的克隆选择原理和记忆机制,提出了一种基于人工免疫原理的混合聚类算法.该算法引入了记忆抗体的分化和抑制机制,可有效地摆脱局部最优点;同时还集成了K-均值搜索算子,用于加快收敛速度.与K-均值方法比较,其具有更快的收敛速度和更高的收敛精度.仿真结果表明,所提算法是有效的. 相似文献
17.
在现有多种距离度量和传统谱聚类算法的基础上,提出了一种新的基于有效距离的谱聚类算法(spectral clustering based on effective distance,SCED)。SCED算法通过稀疏重构系数来构建样本与样本之间的有效距离,从而代替传统谱聚类算法中的欧氏距离,进行样本之间的相似度评估。与传统距离度量相比,有效距离不仅利用了样本对之间的距离信息,同时考虑了目标样本与其他所有相关样本之间的距离信息,因而该距离度量具有全局特性。在UCI标准数据集上的实验结果表明,SCED算法能有效提高聚类效果。 相似文献
18.
受免疫应答原理的启发, 提出了一种适用于增量数据聚类的人工免疫系统框架, 以及在此框架上的结合混沌的自组织增量聚类新算法, 称为免疫应答算法(Immune response algorithm, IRA). 新算法利用Logistic混沌序列生成初始抗体种群, 利用其多样性识别新增的不属于任何已知簇的数据, 该过程模拟了初次免疫应答. 同时, 初次免疫应答形成的记忆抗体可用于二次免疫应答, 即识别新增的属于已知簇的数据. 为了减少数据冗余, 算法用中心点和代表点表示已知簇并动态更新其识别区域, 这样算法不但能动态、自组织地形成聚类, 而且实现了数据特征的提取. 模拟实验充分显示出该算法无论在聚类质量上还是数据特征的提取上, 都具有一定优势, 且具有参数数量少、速度快、对数据输入次序不敏感的优点, 在实际问题中有一定应用价值. 相似文献
19.
针对标准人工免疫算法存在的早熟收敛和后期收敛速度慢的问题,本文提出了一种基于小生境技术和聚类分析的改进的人工免疫算法。首先运用嵌入进化标记的小生境技术对初始种群进化,“排挤机制”有效地保持种群的多样性,防止了早熟,而标记种群的进化方向则加快了算法的收敛速度。其次聚类方法的应用使得在各极值点附近形成了聚类区域,在不同的聚类区域运用人工免疫的趋同算子和异化算子分别进行粗搜索和细搜索,以保证全局寻优的速度和精度。仿真结果表明,该改进算法较之标准免疫算法,有更快的收敛速度、更强的全局搜索能力和更好的寻优精度。 相似文献