首页 | 本学科首页   官方微博 | 高级检索  
     

基于邻域一致性的异常检测序列集成方法
引用本文:刘意,毛莺池.基于邻域一致性的异常检测序列集成方法[J].计算机科学,2022,49(1):146-152.
作者姓名:刘意  毛莺池
作者单位:河海大学计算机与信息学院 南京211100,水利部水利大数据重点实验室 南京211100
基金项目:国家重点研发课题(2018YFC0407105);国家自然科学基金重点项目(61832005);华能集团重点研发课题(HNKJ17-21)。
摘    要:异常检测已广泛应用于多个应用领域,如网络入侵检测、信用卡欺诈检测等。数据维度的增加导致出现许多不相关和冗余的特征,这些特征会掩盖相关特征,出现假阳性结果。由于高维数据具有稀疏性和距离聚集效应,传统的基于密度、距离等的异常检测算法不再适用。大部分基于机器学习的异常检测研究都关注单一模型,而单一模型在抗过拟合能力上存在一定的不足。集成学习模型有着良好的泛化能力,而且在实际应用中展现出比单一模型更好的预测准确性。文中提出了基于邻域一致性的异常检测序列集成方法(Locality and Consistency Based Sequential Ensemble Method for Outlier Detection, LCSE)。首先基于多样性构造异常检测基本模型,其次根据全局集成一致性筛选出异常候选点,最后考虑数据局部邻域相关性选择并组合基本模型结果。通过实验验证,LCSE相比传统方法异常检测的准确率平均提升了20.7%,与集成算法LSCPAOM和iForest相比,性能(AUC)平均提升了3.6%,因此其性能优于其他集成方法和神经网络方法。

关 键 词:高维数据  异常检测  集成多样性  集成一致性  领域相关性

Locality and Consistency Based Sequential Ensemble Method for Outlier Detection
LIU Yi,MAO Ying-chi.Locality and Consistency Based Sequential Ensemble Method for Outlier Detection[J].Computer Science,2022,49(1):146-152.
Authors:LIU Yi  MAO Ying-chi
Affiliation:(College of Computer and Information,Hohai University,Nanjing 211100,China;Key Laboratory of Water Big Data Technology of Ministry of Water Resources,Nanjing 211100,China)
Abstract:
Keywords:High-dimensional data  Outlier detection  Ensemble diversity  Ensemble consistency  Neighborhood correlation
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号