首页 | 本学科首页   官方微博 | 高级检索  
     

一种主题句发现的中文自动文摘研究
引用本文:王萌,李春贵,唐培和,王晓荣.一种主题句发现的中文自动文摘研究[J].计算机工程,2007,33(8):180-181,189.
作者姓名:王萌  李春贵  唐培和  王晓荣
作者单位:1. 广西工学院计算机工程系,柳州,545006
2. 华中师范大学计算机科学系,武汉,430079
基金项目:广西科学基金 , 广西教育厅科研项目 , 广西工学院校科研和教改项目
摘    要:提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。

关 键 词:主题句发现  自动文摘  句子聚类  自然语言处理
文章编号:1000-3428(2007)08-0180-02
修稿时间:2006-04-27

Chinese Automatic Summarization Based on Thematic Sentence Discovery
WANG Meng,LI Chungui,TANG Peihe,WANG Xiaorong.Chinese Automatic Summarization Based on Thematic Sentence Discovery[J].Computer Engineering,2007,33(8):180-181,189.
Authors:WANG Meng  LI Chungui  TANG Peihe  WANG Xiaorong
Affiliation:1. Department of Computer Engineering, Guangxi University of Technology, Liuzhou 545006; 2. Department of Computer Science, Central China Normal University, Wuhan 430079
Abstract:Automatic summarization is one of main research fields in natural language processing.This paper proposes a special Chinese automatic summarization method based on discovering thematic sentences,which uses terms as minimal semantic unit rather than word,and employs term length term frequency(TLTF) to compute weight of term to obtain feature.It uses an improved k-means method to cluster sentences,and discovers thematic sentences according to clustering results.Experimental results indicate a clear superiority of the proposed method over the traditional method under the proposed evaluation scheme.
Keywords:Thematic sentence discovery  Automatic text summarization  Sentences clustering  Natural language processing
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号