首页 | 本学科首页   官方微博 | 高级检索  
     

基于潜在语义索引和句子聚类的中文自动文摘
引用本文:陈戈,段建勇,陆汝占.基于潜在语义索引和句子聚类的中文自动文摘[J].计算机仿真,2008,25(7).
作者姓名:陈戈  段建勇  陆汝占
作者单位:上海交通大学计算机科学与工程系,上海,200240
基金项目:国家自然科学基金(60496326):863计划资助项目
摘    要:自动文摘是自然语言处理领域的一项重要的研究课题.提出一种基于潜在语义索引和句子聚类的中文自动文摘方法.该方法的特色在于:使用潜在语义索引计算句子的相似度,并将层次聚类算法和K-中心聚类算法相结合进行句子聚类,这样提高了句子相似度计算和主题划分的准确性,有利于生成的文摘在全面覆盖文档主题的同时减少自身的冗余.实验结果验证了该文提出的方法的有效性,对比传统的基于聚类的自动文摘方法,该方法生成的文摘质量获得了显著的提高.

关 键 词:自动文摘  潜在语义索引  句子聚类

Chinese Automatic Text Summarization Based on Latent Semantic Indexing and Sentence Clustering
CHEN Ge,DUAN Jian-yong,LU Ru-zhan.Chinese Automatic Text Summarization Based on Latent Semantic Indexing and Sentence Clustering[J].Computer Simulation,2008,25(7).
Authors:CHEN Ge  DUAN Jian-yong  LU Ru-zhan
Affiliation:CHEN Ge,DUAN Jian-yong,LU Ru-zhan(Department of Computer Science , Engineering,SJTU,Shanghai 200240,China)
Abstract:Automatic text summarization is an important issue in Natural Language Processing.This paper has proposed a Chinese automatic text summarization method based on latent semantic indexing(LSI) and sentence clustering.The Specificity of this paper is that LSI is used to calculate sentence similarity and k-medoids clustering is combined with hierarchical clustering to identify topics in the document,which improves the accuracy of sentence similarity calculation and topic identification so that the created summa...
Keywords:Automatic text summarization  Latent semantic indexing  Sentence clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号