深度代码模型安全综述 |
| |
作者姓名: | 孙伟松 陈宇琛 赵梓含 陈宏 葛一飞 韩廷旭 黄胜寒 李佳讯 房春荣 陈振宇 |
| |
作者单位: | 计算机软件新技术国家重点实验室 (南京大学), 江苏 南京 210093;南京大学 软件学院, 江苏 南京 210093;苏州大学 数学科学学院, 江苏 苏州 215006 |
| |
基金项目: | 国家自然科学基金(61932012, 62372228) |
| |
摘 要: | 随着深度学习技术在计算机视觉与自然语言处理等领域取得巨大成功, 软件工程研究者开始尝试将其引入到软件工程任务求解当中. 已有研究结果显示, 深度学习技术在各种代码相关任务(例如代码检索与代码摘要)上具有传统方法与机器学习方法无法比拟的优势. 这些面向代码相关任务训练的深度学习模型统称为深度代码模型. 然而, 由于神经网络的脆弱性和不可解释性, 与自然语言处理模型与图像处理模型一样, 深度代码模型安全也面临众多挑战, 已经成为软件工程领域的焦点. 近年来, 研究者提出了众多针对深度代码模型的攻击与防御方法. 然而, 目前仍缺乏对深度代码模型安全研究的系统性综述, 不利于后续研究者对该领域进行快速的了解. 因此, 为了总结该领域研究现状、挑战及时跟进该领域的最新研究成果, 搜集32篇该领域相关论文, 并将现有的研究成果主要分为后门攻击与防御技术和对抗攻击与防御技术两类. 按照不同技术类别对所收集的论文进行系统地梳理和总结. 随后, 总结该领域中常用的实验数据集和评估指标. 最后, 分析该领域所面临的关键挑战以及未来可行的研究方向, 旨在为后续研究者进一步推动深度代码模型安全的发展提供有益指导.
|
关 键 词: | 深度代码模型 深度代码模型安全 人工智能模型安全 后门攻击与防御 对抗攻击与防御 |
收稿时间: | 2023-12-18 |
修稿时间: | 2024-02-12 |
|
| 点击此处可从《软件学报》浏览原始摘要信息 |
|
点击此处可从《软件学报》下载免费的PDF全文 |
|