首页 | 本学科首页   官方微博 | 高级检索  
     

基于代码模式的软件问答文档检索优化方法
作者单位:;1.北京大学信息科学技术学院;2.高可信软件技术教育部重点实验室;3.北京大学(天津滨海)新一代信息技术研究院
摘    要:开发人员通常通过问答网站的搜索引擎进行相关软件问答文档的搜索。在检索结果中,包含优质代码片段(使用示例)的问答文档往往更受青睐,但如何度量这些文档中代码片段的质量仍是个巨大的挑战。针对这个问题,提出了一种基于代码模式的软件问答文档检索优化方法。该方法能够基于当前检索结果,抽取文档中的代码片段,分析代码片段中的公共代码模式,并基于代码模式度量文档中代码片段的质量,从原有检索结果中向用户推荐高质量的软件问答文档。以软件开发人员在实践过程中遇到的真实问题为基础进行了实验,对比Stack Overflow的搜索结果,所提方法在准确率指标NDCG@5上提升了40%。

关 键 词:代码模式  软件问答文档  文档检索

Refine Software Q&A Document Search Results Based on Code Pattern
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号