首页 | 本学科首页   官方微博 | 高级检索  
     

面向高维大数据的局部离群点并行检测算法
引用本文:何美玲,李佩雅. 面向高维大数据的局部离群点并行检测算法[J]. 计算机仿真, 2022, 39(2): 304-308. DOI: 10.3969/j.issn.1006-9348.2022.02.058
作者姓名:何美玲  李佩雅
作者单位:浙江中医药大学信息技术中心,浙江 杭州310000,暨南大学网络空间安全学院,广东 广州510632
基金项目:浙江中医药大学校级科研项目
摘    要:
当前局部离群点并行检测算法在实现时,没有消除局部离群点中存在的冗余数据,存在k值不稳定、局部可达密度低、检测时间长的问题,严重影响数据的正常使用,于是提出面向高维大数据的局部离群点并行检测算法。根据信息熵原理采用E-PCA算法提取高维大数据的特征,并消除冗余特征,实现高维大数据的降维处理,提高算法的检测精度;为了在较短的时间内完成局部离群点的并行检测,结合Hadoop分布式平台中的Mapreduce分布框架和传统的离群点检测算法,在高维大数据中完成局部离群点的并行检测。仿真结果表明,所提算法的k值适中、局部可达密度高和检测时间短。

关 键 词:局部离群点  降维处理  信息熵  分布式平台

Local Outlier Parallel Detection Algorithm for High-Dimensional Big Data
HE Mei-ling,LI Pei-ya. Local Outlier Parallel Detection Algorithm for High-Dimensional Big Data[J]. Computer Simulation, 2022, 39(2): 304-308. DOI: 10.3969/j.issn.1006-9348.2022.02.058
Authors:HE Mei-ling  LI Pei-ya
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号