共查询到15条相似文献,搜索用时 88 毫秒
1.
一种基于GA的混合属性特征大数据集聚类算法 总被引:2,自引:0,他引:2
在数据挖掘中,经常会遇到和分析大量具有数值和类属特征的数据。然而,现有的大多数算法只能单独处理数值特征数据或类属特征数据,而不能分析具有混合属性的数据。为此,该文提出了一种基于GA的模糊聚类新算法,通过改进聚类目标函数将数值特征与类属特征相结合,从而实现具有混合属性特征数据的聚类分析;通过引入GA算法能够快速得到全局最优解,而且不依赖于原型初始化。实验结果表明,基于GA的新聚类算法对于处理具有混合特征的大数据集聚类问题是相当有效的。 相似文献
2.
基于目标函数的聚类算法是目前应用最为广泛的聚类分析方法之一.然而这类算法都需要类别数和聚类原型的先验知识,且只能分析具有相同原型的数值型数据.此外这类算法还存在对初始化敏感,易陷入局部极值点等弱点.为此,本文提出一种基于克隆算法的网络结构聚类新算法以实现聚类分析的自动化.由于新算法将克隆选择与禁忌克隆相结合,使网络既具有免疫的特异性又具有免疫的耐受性,通过分析网络神经元的最小生成树,能够快速准确地获得类别数以及相关的分类信息.对各种类型的数据集的测试结果均表明,本文提出的新算法对于处理具有混和特征的数据集聚类分析问题是相当便捷有效的. 相似文献
3.
4.
基于特征加权的模糊聚类新算法 总被引:41,自引:3,他引:41
在聚类分析中,针对不同类型的数据,人们设计了模糊k-均值、k-mode以及k-原型算法以分别适合于数值型、类属型和混合型数据.但无论上述哪种方法都假定待分析样本的各维特征对分类的贡献相同.为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出一种基于特征加权的模糊聚类新算法,通过ReliefF算法对特征进行加权选择,不仅能够将模糊k-均值、k-mode以及k-原型算法合而为一,同时使样本的分类效果更好,而且还可以分析各维特征对分类的贡献程度.对各种实际数据集的测试实验结果均显示出新算法的优良性能. 相似文献
5.
基于克隆选择聚类的入侵检测 总被引:1,自引:1,他引:1
白琳 《微电子学与计算机》2007,24(3):135-137,141
提出基于克隆选择的模糊聚类算法,将该聚类算法用于网络入侵检测。针对入侵数据的混合属性改进距离测度的计算方法,实现了对大规模混合属性原始数据的异常检测,并能有效检测到未知攻击。在KDDCUP99数据集中进行了对比仿真实验,实验结果表明算法对已知攻击和未知攻击的检测率以及算法的误誊率都是理想的。 相似文献
6.
特征子集选择问题一直是人工智能领域研究的重要内容。特征子集选择算法研究是机器学习和数据挖掘等领域的研究热点。提出了基于差异演化算法的特征子集选择算法,实验证明该算法是简单、正确、有效的,并具有良好的收敛性和稳定性。 相似文献
7.
一种新的基于混合蚁群算法的聚类方法 总被引:6,自引:1,他引:6
建立了聚类分析问题模型,分析了K-均值算法、模拟退火算法和基本蚁群算法的优缺点。对蚁群算法作了改进.思路是K-均值方法混合,利用K-均值方法的结果作为初值。经过比较测试,两种混合蚁群算法的效果都比较好.特别混合方法二的效果最好。 相似文献
8.
9.
10.
针对统计调制模式识别方法中特征值提取和分类器设计两个步骤分开研究的现状,将Boosting特征选择和多层前馈神经网络算法结合研究,设计了一种改进算法,给出算法的具体步骤.使用常用特征值进行仿真实验,结果表明这种改进算法在信噪比在0 dB以上达100%的识别率.相比其他的智能分类算法,信噪比在-6 dB以下时改进算法的识别率有明显提高,因此可以较好地适用于认知无线电这种对识别准确率要求高的场景中.同时对其他分类识别的应用场景也有一定的参考价值. 相似文献
11.
12.
本文针对sIB算法仅适用于共现数据的问题,提出了一种能够自动进行范畴类型数据分析的sIB算法:CD-sIB.该算法根据范畴类型数据的离散化表示、不同属性值有限的特征,进行数据的属性的拓展和二元化处理,基于属性值的出现进行X,Y的联合分布的计算,使得sIB算法可有效应用于范畴类型数据的分析.实验结果表明:CD-sIB算法相对于现有的面向范畴类型数据聚类模式分析的算法GAClust和K-modes具有明显的优势;CD-sIB算法在进行数据属性概化程度高、类数据分布相对平衡的范畴类型数据的分析中,在效率和精确度方面均很突出. 相似文献
13.
一种可分类数据的聚类算法及其应用 总被引:4,自引:1,他引:3
文章给出了一种新颖、高效的用于可分类数据的聚类算法-WeiSC,该算法具有好的精确性,适合大规模数据库中数据的聚类。通过理论推导和实验,证明了算法的正确性和有效性,并结合入侵检测中操作行为的识别,给出了该算法的一个应用实例。 相似文献
14.
一种有效的高维分类数据聚类方法研究 总被引:1,自引:0,他引:1
随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高. 相似文献
15.
针对大规模日志数据的聚类问题,提出了DBk-means算法。该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势。实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上。 相似文献