首页 | 本学科首页   官方微博 | 高级检索  
     

基于后缀数组的克隆检测
引用本文:史庆庆,张丽萍,尹丽丽,刘东升.基于后缀数组的克隆检测[J].计算机工程,2013(9).
作者姓名:史庆庆  张丽萍  尹丽丽  刘东升
作者单位:内蒙古师范大学计算机与信息工程学院,呼和浩特,010022
基金项目:内蒙古自然科学基金资助项目
摘    要:程序员对源代码的拷贝、粘贴及修改活动会导致软件中出现大量克隆代码,增加软件开发和维护的成本。为解决该问题,提出一种新的克隆检测方法。利用基于后缀数组的算法查找重复的 Token 子串,进而检测出克隆代码,开发相应的克隆检测工具SaCD,用其检测29款C语言开源软件。实验结果表明,SaCD能快速有效地检测软件中的Type-1和Type-2语句克隆,其检测速度比传统的克隆检测工具CCFinderx快了近20倍。

关 键 词:克隆代码  克隆检测  Token串  后缀数组  重复子串  DC3算法

Clone Detection Based on Suffix Array
SHI Qing-qing , ZHANG Li-ping , YIN Li-li , LIU Dong-sheng.Clone Detection Based on Suffix Array[J].Computer Engineering,2013(9).
Authors:SHI Qing-qing  ZHANG Li-ping  YIN Li-li  LIU Dong-sheng
Abstract:
Keywords:clone code  clone detection  Token string  suffix array  repeated substring  DC3 algorithm
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号