首页 | 本学科首页   官方微博 | 高级检索  
     

DeepLabel:基于深度学习的问题单分类方法研究
引用本文:李俊毅,陈碧欢,彭鑫,赵文耘.DeepLabel:基于深度学习的问题单分类方法研究[J].计算机应用与软件,2022(4):170-178.
作者姓名:李俊毅  陈碧欢  彭鑫  赵文耘
基金项目:国家自然科学基金项目(61802067);
摘    要:基于机器学习的问题单分类方法无法捕获问题单的文本信息(如标题和描述)中的隐藏语义,从而有碍分类的准确性。为了解决上述问题,从GitHub的1 286个Java项目中,研究了794 601个问题单的标签用法,并识别6个常用的标签来描述问题单类别。提出一个语义增强方法DeepLabel,来自动地对问题单的类别进行分类。DeepLabel建立在神经网络架构上,用于学习问题单中标题和描述的语义表达及问题单和标签之间的语义关联。对30 000个有标签的问题单的实验评估结果表明,DeepLabel在宏平均(Macro-averaging)和微平均(Micro-averaging)的F1-socre上均达到了67.3%,分别较基准方法提高了8.1百分点和8.8百分点。

关 键 词:问题单分类  深度学习  语义理解
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号