首页 | 本学科首页   官方微博 | 高级检索  
     

基于Gensim的摘要自动生成算法研究与实现
引用本文:肖元君,吴国文. 基于Gensim的摘要自动生成算法研究与实现[J]. 计算机应用与软件, 2019, 36(12)
作者姓名:肖元君  吴国文
作者单位:东华大学计算机科学与技术学院 上海201600
摘    要:为了让计算机能够对中文文章提取摘要,提出一种中文摘要自动生成算法。该算法基于Gensim自然语言处理框架实现,并在原有的基础上做出了改进,算法主要分为两个阶段。关键句生成阶段,对中文语料进行预处理,并放入Gensim框架中的Word2vec模型进行训练,修改TextRank算法使其能够接受词向量的输入生成无向图从而找到关键句;摘要生成框架构建阶段,根据文章结构与Gensim框架中的LDA主题模型所提取的关键词,赋予句子不同的权值,将分数高的几个句子组合生成文章摘要。Rouge摘要评测结果表明,该算法生成的摘要能够包含文章关键信息,相比于其他自动文摘算法,句意通顺程度得到了提升。

关 键 词:Gensim框架  Word2vec模型  TextRank算法  摘要生成框架  LDA主题模型  Rouge摘要评测

RESEARCH AND IMPLEMENTATION OF GENSIM-BASED ABSTRACT AUTOMATIC GENERATION ALGORITHM
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号