首页 | 本学科首页   官方微博 | 高级检索  
     

项目上下文增强的自动代码摘要
引用本文:胡天翔,谢睿,叶蔚,张世琨. 项目上下文增强的自动代码摘要[J]. 软件学报, 2023, 34(4): 1695-1710
作者姓名:胡天翔  谢睿  叶蔚  张世琨
作者单位:北京大学 软件工程国家工程研究中心, 北京 100871
基金项目:中国博士后科学基金(2021M700216)
摘    要:代码摘要通过生成源代码片段的简短自然语言描述, 可帮助开发人员理解代码并减少文档工作. 近期, 关于代码摘要的研究工作主要采用深度学习模型, 这些模型中的大多数都在由独立代码摘要对组成的大型数据集上进行训练. 尽管取得了良好的效果, 这些工作普遍忽略了代码片段和摘要的项目级上下文信息, 而开发人员在编写文档时往往高度依赖这些信息. 针对该问题, 研究了一种与开发者行为和代码摘要工具实现更加一致的代码摘要场景——项目级代码摘要, 其中, 创建了用于项目特定代码摘要的数据集, 该数据集包含800k方法摘要对及其生命周期信息, 用于构建特定时刻准确的项目项目上下文; 提出了一种新颖的深度学习方法, 利用高度相关的代码片段及其相应的摘要来表征上下文语义, 并通过迁移学习整合从大规模跨项目数据集中学到的常识. 实验结果表明: 基于项目级上下文的代码摘要模型不仅能够比通用代码摘要模型获得显著的性能提升, 同时, 针对特定项目能够生成更一致的摘要.

关 键 词:代码摘要  项目上下文  迁移学习
收稿时间:2022-01-05
修稿时间:2022-04-21

Contextual Information Enhanced Source Code Summarization
HU Tian-Xiang,XIE Rui,YE Wei,ZHANG Shi-Kun. Contextual Information Enhanced Source Code Summarization[J]. Journal of Software, 2023, 34(4): 1695-1710
Authors:HU Tian-Xiang  XIE Rui  YE Wei  ZHANG Shi-Kun
Affiliation:National Enginering Rearch Center for Software Enginering, Peking University, Beijing 100871, China
Abstract:
Keywords:code summarization  contextual information  transfer learning
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号