首页 | 本学科首页   官方微博 | 高级检索  
     

基于归一化特征判别的日志模板挖掘算法
作者姓名:双锴  李怡雯  吕志恒  韩静  刘建伟
作者单位:1. 北京邮电大学 网络与交换技术国家重点实验室, 北京 100876;
2. 通信网信息传输与分发技术重点实验室, 石家庄 050081;
3. 中兴通讯股份有限公司, 深圳 518057
基金项目:国家重点研发计划项目(2016QY01W0200);上海市青年科技英才扬帆计划项目(18YF1423300);通信网信息传输与分发技术重点实验室开放基金课题(SXX18641X024)
摘    要:针对传统日志模板挖掘时需要日志聚类数目作为先验信息的问题,提出了一种基于归一化特征判别的日志模板挖掘算法.首先,对日志数据进行压缩,以提高后续处理效率;其次,进行日志聚类过程,使用归一化的日志统计特征判断聚类是否满足要求,若满足,则聚类成功;若不满足,则采用二分搜索的方式调整日志聚类的数目,重新进行聚类;最后,从聚类结果中提取日志模板,设计了一种衡量模板挖掘效果的评价指标.在真实数据集上的实验结果表明,算法的模板挖掘匹配度优于基准方法,并且具有良好的泛化性能.

关 键 词:模板挖掘  日志分析  文本聚类  归一化特征  
收稿时间:2019-03-22
点击此处可从《北京邮电大学学报》浏览原始摘要信息
点击此处可从《北京邮电大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号