面向不完全攻击数据集的两阶段聚类算法 |
| |
作者姓名: | 邱江 秦拯 |
| |
作者单位: | 湖南大学信息科学与工程学院 |
| |
基金项目: | 国家自然科学基金(No.61070194) |
| |
摘 要: | 实时攻击数据集含有缺失属性和大量非攻击样本,呈现属性分布不完全和类分布偏斜的特点,不利于聚类分析。针对此问题,提出了一种面向不完全攻击数据集的两阶段聚类算法。算法首先利用标准2-类支持向量机分离数据集中的非攻击样本,使类分布均衡。提出一种不完全样本间的距离度量方法,将该方法应用于最近邻间隔模糊C均值算法实现聚类。实验结果表明,与现有算法相比,提出的算法有效地提高了聚类准确率。
|
关 键 词: | 聚类分析 缺失属性 支持向量机 最近邻间隔 |
本文献已被 CNKI 等数据库收录! |
|