首页 | 本学科首页   官方微博 | 高级检索  
     

基于时间戳的多文档自动文摘
引用本文:索红光,梁玉环,刘玉树. 基于时间戳的多文档自动文摘[J]. 计算机工程, 2007, 33(16): 164-165
作者姓名:索红光  梁玉环  刘玉树
作者单位:北京理工大学计算机科学与技术学院,北京,100081;中国石油大学计算机与通信工程学院,东营,257061;中国石油大学计算机与通信工程学院,东营,257061;北京理工大学计算机科学与技术学院,北京,100081
摘    要:网站的新闻专题往往包含大量的网页,多文档自动文摘可以帮助人们从中快速获取主要信息。该文提出了利用时间戳改善文摘句子抽取质量和排序的方法。介绍了句子抽取方法、句子重要度计算、句子冗余减小方法。实验表明,形成的文摘性能良好,可以应用于实际系统中。

关 键 词:多文档自动文摘  时间戳  信息抽取  句子相似度
文章编号:1000-3428(2007)16-0164-02
修稿时间:2006-08-30

Automatic Multidocument Summarization Based on Time Stamp
SUO Hong-guang,LIANG Yu-huan,LIU Yu-shu. Automatic Multidocument Summarization Based on Time Stamp[J]. Computer Engineering, 2007, 33(16): 164-165
Authors:SUO Hong-guang  LIANG Yu-huan  LIU Yu-shu
Affiliation:1. School of Computer Science and Technology, Beijing Institute of Technology, Beijing 100081 ; 2. School of Computer and Communication Engineering, China University of Petroleum, Dongying 257061
Abstract:News special topic in Web site has plentiful pages. People can get main information rapidly by automatic multidocument summarization. A method which uses time stamp to improve sentence extraction quality is presented. The method of news sentence extraction, sentence importance calculation, and redundancy reducing is introduced. Experimental results show that summarization is good enough for practical application.
Keywords:automatic multidocument summarization   time stamp   information extraction   sentence similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号