首页 | 本学科首页   官方微博 | 高级检索  
     

基于词汇链的多文档自动文摘研究
引用本文:邓箴,包宏.基于词汇链的多文档自动文摘研究[J].计算机与应用化学,2012,29(11):1384-1386.
作者姓名:邓箴  包宏
作者单位:1. 宁夏大学数学计算机学院,宁夏,银川,750021
2. 北京科技大学信息工程学院,北京,100083
基金项目:宁夏大学科学研究基金资助项目
摘    要:提出了一种基于词汇链抽取,文法分析的抽取文本代表词条的多文档摘要生成的方法。通过计算词义相似度构建词汇链,结合词频与位置特征进行文本代表词条成员的选择,将含有词条权值高的句子经过聚类形成多文档文摘句集合,然后进行质心句的抽取和排序,生成多文档文摘。该方法不仅考虑了词汇之间的语义信息,还考虑了词条对文本的代表成度,能够改善文摘句抽取的性能。实验结果表明,与单纯的由关键词确定文摘的方法相比,召回率和准确率都有不少的提高。

关 键 词:多文档文摘  词汇链  聚类  词条  词义相似度

Research of multi-document summarization based on lexical chains
Deng Zhen , Bao Hong.Research of multi-document summarization based on lexical chains[J].Computers and Applied Chemistry,2012,29(11):1384-1386.
Authors:Deng Zhen  Bao Hong
Affiliation:1. Department of Mathematics and Computer, Ningxia University, Yinchuan, 750021, Ningxia, China) (2. College of information Engineering, Beijing University of Science and Technology, Beijing,100083, China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号