融合知识的小片段代码相似性比较模型 |
| |
引用本文: | 夏冰,周鑫,庞建民,岳峰,单征.融合知识的小片段代码相似性比较模型[J].计算机工程与设计,2023(8):2360-2366. |
| |
作者姓名: | 夏冰 周鑫 庞建民 岳峰 单征 |
| |
作者单位: | 1. 信息工程大学网络空间安全学院;2. 中原工学院前沿信息技术研究院;3. 信息工程大学嵩山实验室 |
| |
基金项目: | 国家自然科学基金项目(61802435、61802433);;河南省高等学校重点科研基金项目(22B520054); |
| |
摘 要: | 二进制小片段代码指令序列较短,基本块逻辑调用图结构简单,有限语义信息影响代码相似性比较结果,为此提出一种融合知识表示学习的二进制代码小片段相似性比较模型(BSM)。分别提取小片段代码的函数知识和函数代码,利用注意力机制和双向长短记忆得到知识嵌入,使用序列学习模型或图神经网络得到函数嵌入,融合知识嵌入和函数嵌入作为小片段代码向量表示。实验结果表明,BSM模型在跨平台比较上优于其它对比模型,说明模型能提升小片段代码比较的准确度。
|
关 键 词: | 二进制代码 跨平台 小片段比较 神经网络 自然语言处理 知识表示学习 代码表示学习 |
|
|