首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于共现关键词的TextRank文摘自动生成算法
引用本文:阎红灿,李铂初,谷建涛.一种基于共现关键词的TextRank文摘自动生成算法[J].计算机工程与科学,2023(11):2060-2069.
作者姓名:阎红灿  李铂初  谷建涛
作者单位:1. 华北理工大学理学院;2. 河北省数据科学与应用重点实验室
基金项目:河北省高等教育教学改革研究与实践项目(2020GJJG158);
摘    要:传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明,所提算法能够提高生成摘要的全面性和准确性。同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况。

关 键 词:自动摘要生成  TextRank  共现关键词  MMR算法  word2vec模型
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号