首页 | 本学科首页   官方微博 | 高级检索  
     

面向订票服务器端爬虫的可视检测方法研究
引用本文:吴向阳,陈万烤,张祯,王程,刘宇.面向订票服务器端爬虫的可视检测方法研究[J].计算机辅助设计与图形学学报,2018(1).
作者姓名:吴向阳  陈万烤  张祯  王程  刘宇
作者单位:杭州电子科技大学图形图像研究所;中国民航信息网络股份有限公司;
摘    要:恶意下载爬虫对电子商务造成了不可忽视的损失,为此设计了一套适用于各航空公司的通用查订票爬虫检测系统.首先系统以航线图、柱状图、饼图等多种可视化手段展现各时段的爬虫检测效果;其次基于SVM分类器,并结合IP地址聚合和查询量排序技术,设计了高效识别动态IP爬虫等多种爬虫的检测算法;最后通过特征筛选、IP历史详情查询等可视界面支持用户手工筛选训练样本,以更新SVM分类模型.以某航空公司访问E-Build服务器的日志数据进行的实验结果表明,该系统能够有效地抓取多种爬虫,大大降低无效查询量,并且能方便地更新分类模型,保持检测算法的长效性.

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号