首页 | 本学科首页   官方微博 | 高级检索  
     

基于查询的新闻多文档自动摘要技术研究
引用本文:王凯祥,任明.基于查询的新闻多文档自动摘要技术研究[J].中文信息学报,2019,33(4):93-100.
作者姓名:王凯祥  任明
作者单位:中国人民大学 信息资源管理学院,北京 100872
基金项目:国家自然科学基金(71402186)
摘    要:针对新闻文本领域,该文提出一种基于查询的自动文本摘要技术,更加有针对性地满足用户信息需求。根据句子的TF-IDF、与查询句的相似度等要素,计算句子权重,并根据句子指示的时间给定不同的时序权重系数,使得最近发生的新闻内容具有更高的权重,最后使用最大边界相关的方法选择摘要句。通过与基于TF-IDF、Text-Rank、LDA等六种方法的对比,该摘要方法ROUGE评测指标上优于其他方法。从结合评测结果及摘要示例可以看出,该文提出的方法可以有效地从新闻文档集中摘取核心信息,满足用户查询内容的信息需求。

关 键 词:自动文本摘要  基于查询的摘要  新闻文本  分布式表示  

Query-based Multi-document Automatic Summarization of News
WANG Kaixiang,REN Ming.Query-based Multi-document Automatic Summarization of News[J].Journal of Chinese Information Processing,2019,33(4):93-100.
Authors:WANG Kaixiang  REN Ming
Affiliation:School of Information Resource Management, Renmin University of China, Beijing 100872, China
Abstract:This paper proposes a query based automatic text summarization method, which is targeted to meet users' information needs of news. It assigns the weight of the sentence according to the TF-IDF, the similarity of sentence to the query, and the time of the sentence indicating (with a bias favoring the recent news). Finally, the method of the Maximal Marginal Relevance is used to select the summary sentence. Compared with six existing methods, the method proposed in this paper is superior in terms of ROUGE.
Keywords:automatic text summarization  query-based summary  news text  distributed representation  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号