融合信息检索和深度模型特征的软件缺陷定位方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合信息检索和深度模型特征的软件缺陷定位方法

作者姓名：	申宗汶牛菲菲李传艺陈翔李奇葛季栋骆斌

作者单位：	计算机软件新技术全国重点实验室(南京大学), 江苏南京 210023;南通大学信息科学技术学院, 江苏南通 226019

基金项目：	国家重点研发计划(2022YFF0711404);江苏省第六期“333工程”领军型人才团队项目和江苏省自然科学基金(No.BK20201250)

摘要：	构建自动化的缺陷定位方法能够加快程序员利用缺陷报告定位到复杂软件系统缺陷代码的过程.早期相关研究人员将缺陷定位视为检索任务,通过分析缺陷报告和相关代码构造缺陷特征,并结合信息检索的方法实现缺陷定位.随着深度学习的发展,利用深度模型特征的缺陷定位方法也取得了一定效果.然而,由于深度模型训练的时间成本和耗费资源相对较高,现有基于深度模型的缺陷定位研究方法存在实验搜索空间和真实情况不符的情况.这些研究方法在测试时并没有将项目下的所有代码作为搜索空间,而仅仅搜索了与已有缺陷相关的代码,例如DNNLOC方法、DeepLocator方法、DreamLoc方法.这种做法和现实中程序员进行缺陷定位的搜索场景是不一致的.致力于模拟缺陷定位的真实场景,提出了一种融合信息检索和深度模型特征的TosLoc方法进行缺陷定位.TosLoc方法首先通过信息检索的方式检索真实项目的所有源代码,确保已有特征的充分利用;再利用深度模型挖掘源代码和缺陷报告的语义,获取最终定位结果.通过两阶段的检索,TosLoc方法能够对单个项目的所有代码实现快速缺陷定位.通过在4个常用的真实Java项目上进行实验, TosLoc方法能够在检索速度和准确性上超越已有基准方法.与最优基准方法 DreamLoc相比, TosLoc方法在消耗DreamLoc方法 35%的检索时间下,平均MRR值比DreamLoc方法提高了2.5%,平均MAP值提高了6.0%.
关键词：	缺陷定位缺陷报告信息检索深度学习检索空间
收稿时间：	2023-09-11
修稿时间：	2023-10-30

	点击此处可从《软件学报》浏览原始摘要信息
	点击此处可从《软件学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏