首页 | 本学科首页   官方微博 | 高级检索  
     

基于TextRank的自动摘要优化算法
引用本文:李娜娜,刘培玉,刘文锋,刘伟童.基于TextRank的自动摘要优化算法[J].计算机应用研究,2019,36(4).
作者姓名:李娜娜  刘培玉  刘文锋  刘伟童
作者单位:山东师范大学信息科学与工程学院,济南250358;山东省分布式计算机软件新技术重点实验室,济南250358;山东师范大学信息科学与工程学院,济南250358;菏泽学院计算机学院,山东菏泽274015
基金项目:国家自然科学基金资助项目(61373148);国家青年自然科学基金资助项目(61502151);山东省社科规划项目(17CHLJ18,17CHLJ33,17CHLJ30);山东省自然科学基金资助项目(ZR2014FL010);山东省教育厅基金资助项目(J15LN34)
摘    要:在对中文文本进行摘要提取时,传统的TextRank算法只考虑节点间的相似性,忽略了文本的其他重要信息。首先,针对中文单文档,在现有研究的基础上,使用TextRank算法,一方面考虑句子间的相似性,另一方面,使TextRank算法与文本的整体结构信息、句子的上下文信息等相结合,如文档句子或者段落的物理位置、特征句子、核心句子等有可能提升权重的句子,来生成文本的摘要候选句群;然后对得到的摘要候选句群做冗余处理,以除去候选句群中相似度较高的句子,得到最终的文本摘要。最后通过实验验证,该算法能够提高生成摘要的准确性,表明了该算法的有效性。

关 键 词:摘要提取  TextRank  结构信息  候选摘要句群  冗余处理
收稿时间:2017/11/24 0:00:00
修稿时间:2019/2/28 0:00:00

Automatic digest optimization algorithm based on TextRank
linan,liupeiyu,liuwenfeng and liuweitong.Automatic digest optimization algorithm based on TextRank[J].Application Research of Computers,2019,36(4).
Authors:linan  liupeiyu  liuwenfeng and liuweitong
Affiliation:School of Information Science and Engineering, Shandong Normal University,,,
Abstract:When Abstract: ng Chinese texts, the traditional TextRank algorithm only considers the similarity between nodes and neglects other important information of the text. Firstly, aiming at Chinese single document, on the basis of existing research, this paper uses TextRank algorithm, on the one hand, it considers the similarities between sentences, on the other hand, TextRank is combined with the overall structural information of texts and the contextual information of sentences, such as the physical position of the document sentences or paragraph, feature sentences, core sentences and other sentences that may increase the weight of the sentence, all are used to generate the digest candidate sentence group of the text. And then, removing high-similarity sentences by redundancy processing technology on the digest candidate sentence group. Finally, the experimental verification shows that the algorithm can improve the accuracy of the generated digest, indicating the effectiveness of the algorithm.
Keywords:abstract extraction  TextRank  structure information  the digest candidate sentence group  redundancy processing
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号