首页 | 本学科首页   官方微博 | 高级检索  
     

基于代价敏感学习的恶意URL检测研究
作者姓名:蔡勍萌  王健  李鹏博
作者单位:北京交通大学计算机与信息技术学院 北京 中国 100044;中电科网络空间安全研究院 北京 中国 100085
基金项目:本课题得到中国国家铁路集团有限公司科技研究开发计划重点课题(No.N2020W005),以及国家保密技术测评中心项目(No.K20GY500010)的支持资助。
摘    要:随着大数据时代的到来,恶意URL作为Web攻击的媒介渐渐威胁着用户的信息安全。传统的恶意URL检测手段如黑名单检测、签名匹配方法正逐步暴露缺陷,为此本文提出一种基于代价敏感学习策略的恶意URL检测模型。为提高卷积神经网络在恶意网页检测领域的性能,本文提出将URL数据结合HTTP请求信息作为原始数据样本进行特征提取,解决了单纯URL数据过于简单而造成特征提取困难的问题,通过实验对比了三种编码处理方式,根据实验结果选取了最佳字符编码的处理方式,保证了后续检测模型的效果。同时本文针对URL字符输入的特点,设计了适合URL检测的卷积神经网络模型,为了提取数据深层特征,使用了两层卷积层进行特征提取,其次本文在池化层选择使用BiLSTM算法提取数据的时序特征,同时将该网络的最后一个单元输出达到池化效果,避免了大量的模型计算,保证了模型的检测效率。同时为解决数据样本不均衡问题,在迭代过程中为其分配不同惩罚因子,改进了数据样本初始化权重的分配规则并进行了归一化处理,增加恶意样本在整体误差函数中的比重。实验结果表明本文模型在准确率、召回率以及检测效率上较优于其他主流检测模型,并对于不均衡数据集具有较好的抵抗能力。

关 键 词:深度学习  恶意网页  URL检测  代价敏感学习  神经网络
收稿时间:2021/7/21 0:00:00
修稿时间:2021/11/15 0:00:00

Research on Malicious URL Detection Based on Cost-sensitive Learning
Authors:CAI Qingmeng  WANG Jian  LI Pengbo
Affiliation:School of Computer and Information Technology, Beijing Jiaotong University, Beijing, 100044, China; CETC Cyberspace Security Research Institute, Beijing, 100085, China
Abstract:
Keywords:deep Learning  malicious web page  URL detection  cost-sensitive learning  neural networks
点击此处可从《》浏览原始摘要信息
点击此处可从《》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号