一种基于共现关键词的TextRank文摘自动生成算法 |
| |
引用本文: | 阎红灿,李铂初,谷建涛.一种基于共现关键词的TextRank文摘自动生成算法[J].计算机工程与科学,2023(11):2060-2069. |
| |
作者姓名: | 阎红灿 李铂初 谷建涛 |
| |
作者单位: | 1. 华北理工大学理学院;2. 河北省数据科学与应用重点实验室 |
| |
基金项目: | 河北省高等教育教学改革研究与实践项目(2020GJJG158); |
| |
摘 要: | 传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达。为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明,所提算法能够提高生成摘要的全面性和准确性。同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况。
|
关 键 词: | 自动摘要生成 TextRank 共现关键词 MMR算法 word2vec模型 |
|