首页 | 本学科首页   官方微博 | 高级检索  
     

以关键词抽取为核心的文摘句选择策略
引用本文:马亮,何婷婷,李芳,陈劲光,邵伟.以关键词抽取为核心的文摘句选择策略[J].中文信息学报,2008,22(6):50-54.
作者姓名:马亮  何婷婷  李芳  陈劲光  邵伟
作者单位:1. 华中师范大学 计算机科学系,湖北 武汉 430079; 2. 国家语言资源监测与研究中心 网络媒体分中心,湖北 武汉 430079
基金项目:国家自然科学基金,国家自然科学基金,国家自然科学基金,国家自然科学基金,国家自然科学基金
摘    要:针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。

关 键 词:计算机应用  中文信息处理  多文档文摘  关键词抽取  文摘句选择  

Summary Sentence Selection by Keywords Extraction
MA Liang,HE Ting-ting,LI Fang,CHEN Jin-guang,SHAO Wei.Summary Sentence Selection by Keywords Extraction[J].Journal of Chinese Information Processing,2008,22(6):50-54.
Authors:MA Liang  HE Ting-ting  LI Fang  CHEN Jin-guang  SHAO Wei
Affiliation:1. Department of Computer Science, Huazhong Normal University, Wuhan,Hubei 430079,China;2. Network Media Branch, National Language Resources Monitoring and Research Center,
Wuhan,Hubei 430079,China
Abstract:This paper proposes a strategy of summary sentence selection by keywords extraction for query-focused multi-document summarization. This method extracts the query related word features through the technique of query expansion, calculates the topic related feature through maximum likelihood estimation and then combines the two features to determine the importance of each word. The score of candidate sentence is set as the sum of importance of words in it, and the modified MMR technology is used to generate the final summary. Owing to the introduction to word level features, the experimental result shows a satisfactory performance in DUC 2005 corpus.
Keywords:computer application  Chinese information processing  multi-document summarization  keywords extraction  summary sentence selection  
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号