基于Gensim的摘要自动生成算法研究与实现 |
| |
引用本文: | 肖元君,吴国文. 基于Gensim的摘要自动生成算法研究与实现[J]. 计算机应用与软件, 2019, 36(12) |
| |
作者姓名: | 肖元君 吴国文 |
| |
作者单位: | 东华大学计算机科学与技术学院 上海201600 |
| |
摘 要: | 为了让计算机能够对中文文章提取摘要,提出一种中文摘要自动生成算法。该算法基于Gensim自然语言处理框架实现,并在原有的基础上做出了改进,算法主要分为两个阶段。关键句生成阶段,对中文语料进行预处理,并放入Gensim框架中的Word2vec模型进行训练,修改TextRank算法使其能够接受词向量的输入生成无向图从而找到关键句;摘要生成框架构建阶段,根据文章结构与Gensim框架中的LDA主题模型所提取的关键词,赋予句子不同的权值,将分数高的几个句子组合生成文章摘要。Rouge摘要评测结果表明,该算法生成的摘要能够包含文章关键信息,相比于其他自动文摘算法,句意通顺程度得到了提升。
|
关 键 词: | Gensim框架 Word2vec模型 TextRank算法 摘要生成框架 LDA主题模型 Rouge摘要评测 |
RESEARCH AND IMPLEMENTATION OF GENSIM-BASED ABSTRACT AUTOMATIC GENERATION ALGORITHM |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|