首页 | 本学科首页   官方微博 | 高级检索  
     

一种优化的AP-CAPSA中文文本结构分析算法*
引用本文:刘亚亮,卢选民,冯莎,王兴亮. 一种优化的AP-CAPSA中文文本结构分析算法*[J]. 计算机应用研究, 2012, 29(1): 137-139
作者姓名:刘亚亮  卢选民  冯莎  王兴亮
作者单位:西北工业大学电子信息学院,西安,710129
基金项目:2011年西北工业大学研究生创新性实验项目
摘    要:从段落向量空间模型、特征词权重等多个侧面分析比较了已有的文本结构分析算法,提出了优化的AP-CAPSA算法;给出了算法性能的评价准则,并在不同的语料集合上进行了测试。实验表明该方法能够更有效地反映文本的结构,为中文自动摘要系统奠定了重要的理论基础。

关 键 词:文本结构  中文自动摘要  段落向量空间模型  特征词权重  评价准则

Improved AP-CAPSA Chinese text structure analysis algorithm
LIU Ya-liang,LU Xuan-min,FENG Sh,WANG Xing-liang. Improved AP-CAPSA Chinese text structure analysis algorithm[J]. Application Research of Computers, 2012, 29(1): 137-139
Authors:LIU Ya-liang  LU Xuan-min  FENG Sh  WANG Xing-liang
Affiliation:(School of Electronics & Information,Northwestern Polytechnical University,Xi’an 710129,China)
Abstract:This paper studied the existing text structure analysis methods from several aspects including the paragraphic vector space model and the term weighting.It proposed and illustrated an improved structure analysis algorithm in detail.Also,gave the algorithm performance evaluation criteria.Finally,according to tests of a collection of different corpus,this method can reflect the structure of text more effectively.This lays a good foundation for the research of the Chinese automatic summarization system.
Keywords:text structure   Chinese automatic summarization   paragraphic vector space model   term weighing   evaluation criteria
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号