首页 | 本学科首页   官方微博 | 高级检索  
     

基于Python爬虫技术的虚假数据溯源与过滤
引用本文:陈丛,周力臻. 基于Python爬虫技术的虚假数据溯源与过滤[J]. 计算机仿真, 2021, 38(3): 346-350. DOI: 10.3969/j.issn.1006-9348.2021.03.070
作者姓名:陈丛  周力臻
作者单位:福建师范大学协和学院,福建福州350117
基金项目:福建省中青年教师教育科研项目
摘    要:针对现有网络虚假数据追踪与过滤方法中存在的追踪定位精度低、过滤覆盖范围小的问题,提出基于Python爬虫技术的虚假数据溯源与途中过滤.将虚假数据覆盖的网络划分为相同大小的网格,根据一定概率标记数据包;分析Python爬虫抓取过程,以适用多场景、界面可视化、负载均衡为系统设计目标,设计爬虫管理器、采集器与内嵌浏览器硬件设备;结合系统爬取数据流程描述各软件模块的协作方式;在系统中部署节点,建立协作关系区域,利用布隆过滤器生成数据包,通过共享密钥证明MAC是否合法,启动溯源过程;在溯源途中若节点不存在任何一个密钥,则将其过滤,完成虚假数据溯源与途中过滤.仿真结果证明,上述方对虚假数据的过滤效果较高,且对虚假数据溯源定位精度较高.

关 键 词:爬虫技术  虚假数据  途中过滤  共享密钥  负载均衡

Tracing and Filtering of Fake Data Based On Python Crawler Technology
CHEN Cong,ZHOU Li-zhen. Tracing and Filtering of Fake Data Based On Python Crawler Technology[J]. Computer Simulation, 2021, 38(3): 346-350. DOI: 10.3969/j.issn.1006-9348.2021.03.070
Authors:CHEN Cong  ZHOU Li-zhen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号