一种基于FastText的恶意代码家族分类方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于FastText的恶意代码家族分类方法

引用本文：	张宇迪,冯永新,赵运弢.一种基于FastText的恶意代码家族分类方法[J].沈阳理工大学学报,2024(1):61-68+90.

作者姓名：	张宇迪冯永新赵运弢

作者单位：	沈阳理工大学信息科学与工程学院

基金项目：	国家自然科学基金项目(61971291)；

摘要：	传统的恶意代码家族分类方法主要通过代码家族浅层关联特征的统计分析达到分类和识别的目的。随着恶意代码加壳、混淆、多态技术的发展，传统方法的局限性逐渐显现，但恶意代码需调用API函数达成恶意目的始终是其不变的行为特征。基于embedding、word2vec模型的传统方法缺乏对低频API函数的特征提取能力，在表征API序列局部顺序特征时易产生映射失真，存在词典外API行为扩展、推理能力弱等导致分类准确率下降的不足。由此，引入负采样优化的FastText框架以加强对API序列映射的准确度，提出一种基于FastText框架下的恶意代码家族分类方法。利用FastText框架实现代码样本API序列的多维向量转换和精准表达，结合一维卷积及长短时记忆(LSTM)网络进一步提取API行为局部特征。实验结果表明，该模型的性能相较于传统的embedding方法和word2vec框架性能更优，准确率可达99%以上。
关键词：	FastText 恶意代码家族分类长短时记忆网络