首页 | 本学科首页   官方微博 | 高级检索  
     

潜在语义分析聚类算法在文摘句子排序中的应用
引用本文:郭红建,黄 兵.潜在语义分析聚类算法在文摘句子排序中的应用[J].计算机应用研究,2013,30(11):3299-3301.
作者姓名:郭红建  黄 兵
作者单位:南京审计学院 信息科学学院, 南京 211815
基金项目:国家自然科学基金资助项目(61170105); 江苏省公共工程审计重点实验室2012年开放课题(20201201211)
摘    要:针对多文档文摘生成过程中话题容易中断和文摘句子语义出现不连贯这两个研究难点, 分析了潜在语义分析聚类算法在句子排序中的应用, 以期提高文摘的生成质量。先采用潜在语义分析聚类算法将文摘句子聚类, 从而形成话题集, 以达到解决话题中断的目的。通过计算文档的文摘展现力, 挑选出文摘展现力最大的文档作为模板, 然后根据模板对文摘句子进行两趟排序。实验结果表明, 提出的算法是有效的, 该算法能够提高文摘的可读性。

关 键 词:多文档文摘  聚类  句子排序

Application of latent semantic analysis clustering algorithm in summary sentence ordering
GUO Hong-jian,HUANG Bing.Application of latent semantic analysis clustering algorithm in summary sentence ordering[J].Application Research of Computers,2013,30(11):3299-3301.
Authors:GUO Hong-jian  HUANG Bing
Affiliation:School of Information Science, Nanjing Audit University, Nanjing 211815, China
Abstract:In order to improve the performance of summarization, this paper researched on application of latent semantic analysis clustering algorithm in summary sentence ordering. It adopted latent semantic analysis clustering algorithm to cluster summary sentences into topic sets to make the sentences within the same topic without be interrupted. It selected the ordering template by the summary representation of document, and ordered topic sets by the relational position in the template, ordered the sentences in the same topic set by the position in template. The experimental result shows that the proposed method is effective. It improves the readability of the summary.
Keywords:multi-document summarization  clustering  sentence ordering
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号