首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进TextRank算法的中文文本摘要提取
引用本文:徐馨韬,柴小丽,谢彬,沈晨,王敬平.基于改进TextRank算法的中文文本摘要提取[J].计算机工程,2019,45(3):273-277.
作者姓名:徐馨韬  柴小丽  谢彬  沈晨  王敬平
作者单位:中国电子科技集团公司第三十二研究所,上海,201808;中国电子科技集团公司第三十二研究所,上海,201808;中国电子科技集团公司第三十二研究所,上海,201808;中国电子科技集团公司第三十二研究所,上海,201808;中国电子科技集团公司第三十二研究所,上海,201808
摘    要:为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。

关 键 词:Doc2Vec模型  K-MEANS算法  TextRank算法  摘要提取  权重影响因子

Extraction of Chinese Text Summarization Based on Improved TextRank Algorithm
XU Xintao,CHAI Xiaoli,XIE Bin,SHEN Chen,WANG Jingping.Extraction of Chinese Text Summarization Based on Improved TextRank Algorithm[J].Computer Engineering,2019,45(3):273-277.
Authors:XU Xintao  CHAI Xiaoli  XIE Bin  SHEN Chen  WANG Jingping
Affiliation:(The 32nd Research Institute of China Electronics Technology Group Corporation,Shanghai 201808,China)
Abstract:XU Xintao;CHAI Xiaoli;XIE Bin;SHEN Chen;WANG Jingping(The 32nd Research Institute of China Electronics Technology Group Corporation,Shanghai 201808,China)
Keywords:Doc2Vec model  K-means algorithm  TextRank algorithm  summarization extraction  weight influence factor
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号