首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进TextRank的文本摘要自动提取
引用本文:汪旭祥,韩斌,高瑞,陈鹏.基于改进TextRank的文本摘要自动提取[J].计算机应用与软件,2021,38(6):155-160.
作者姓名:汪旭祥  韩斌  高瑞  陈鹏
作者单位:江苏科技大学计算机学院 江苏 镇江212003
摘    要:TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息.对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank).通过Word2 Vec训练的词向量来计算句子之间的相似度,并综合考虑句子位置、句子与标题的相似度、关键词的覆盖率、关键句子以及线索词等影响句子权重的因素,从而优化句子权重;对得到的候选摘要句群进行冗余处理,选取适量排序靠前的句子并根据其在原文中的顺序重新排列得到最终文本的摘要.实验结果表明,SW-TextRank算法生成摘要的准确性比TextRank算法更高,摘要生成质量更好.

关 键 词:文本摘要  SW-TextRank算法  词向量  相似度  句子权重

AUTOMATIC EXTRACTION OF TEXT SUMMARIZATION BASED ON IMPROVED TEXTRANK
Wang Xuxiang,Han Bin,Gao Rui,Chen Peng.AUTOMATIC EXTRACTION OF TEXT SUMMARIZATION BASED ON IMPROVED TEXTRANK[J].Computer Applications and Software,2021,38(6):155-160.
Authors:Wang Xuxiang  Han Bin  Gao Rui  Chen Peng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号