基于混合表征和协同训练的软件漏洞检测期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于混合表征和协同训练的软件漏洞检测

引用本文：	陈浩东,李琳,乔梦晴,叶彪.基于混合表征和协同训练的软件漏洞检测[J].计算机技术与发展,2024(5):126-132.

作者姓名：	陈浩东李琳乔梦晴叶彪

作者单位：	1. 武汉科技大学计算机科学与技术学院;2. 智能信息处理与实时工业系统湖北省重点实验室

摘要：	对于漏洞领域基准数据集较少导致的深度学习模型泛化能力较差，以及传统的基于规则引擎的漏洞检测工具性能较低的问题，提出了一种基于混合表征和协同训练的软件源代码漏洞检测方法。首先，基于预训练模型提取源代码文本特征，提取代码语义信息，然后使用工具生成抽象语法树，通过自定义遍历规则提取源代码的AST(抽象语法树)特征，将两种特征进行混合丰富代码表征。其次，搭建多个深度模型，基于协同训练算法通过大量的无标签数据提升各模型的泛化能力。鉴于单一模型可能造成较高的漏报率和误报率，并可能被某一模型主导预测结果的问题，采用了基于加权投票机制的多模型集成方法。实验结果表明，该方法在一定程度上解决了数据集较少导致的模型泛化性差的问题，与漏洞检测领域一些主流检测方法相比，该方法在各指标上具有一定的优势，且检测性能高于规则引擎Fortify。
关键词：	深度学习混合表征漏洞检测协同训练集成学习

设为首页 | 免责声明 | 关于勤云 | 加入收藏