首页 | 本学科首页   官方微博 | 高级检索  
     

多文档文摘中基于时间信息的句子排序策略研究
引用本文:徐永东,王亚东,刘杨,王伟,权光日.多文档文摘中基于时间信息的句子排序策略研究[J].中文信息学报,2009,23(4):27-34.
作者姓名:徐永东  王亚东  刘杨  王伟  权光日
作者单位:哈尔滨工业大学(威海) 计算机科学与技术学院, 山东 威海 264209
基金项目:国家自然科学基金,哈尔滨工业大学科技创新基金 
摘    要:文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。

关 键 词:计算机应用  中文信息处理  多文档自动文摘  句子排序  中文时间信息处理
  

Research on Temporal Information Based Sentences Ordering in Multi-Document Automatic Summarization
XU Yongdong,WANG Yadong,LIU Yang,WANG Wei,QUAN Guangri.Research on Temporal Information Based Sentences Ordering in Multi-Document Automatic Summarization[J].Journal of Chinese Information Processing,2009,23(4):27-34.
Authors:XU Yongdong  WANG Yadong  LIU Yang  WANG Wei  QUAN Guangri
Affiliation:School of Computer Science and Technology, Harbin Institute of Technology (Weihai),
Weihai, Shandong 264209, China
Abstract:Sentences ordering is a key issue in the multi-documents automatic summarization,which influences the fluency and readability of the summarization.Among them,temporal information processing is the bottleneck technology which affects the quality of the ordering algorithm.Traditional ordering methods ignore this factor because the temporal information processing is very difficult,and,as a result,they could not achieve steady and high-quality ordering effects.To address this issue,this paper proposes an algori...
Keywords:computer applications Chinese informatioh processings multi-documents automatic summarization  sentences ordering  Chinese temporal information processing  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号