首页 | 本学科首页   官方微博 | 高级检索  
     

基于句子权重和篇章结构的政府公文自动文摘算法
作者姓名:毛良文  徐亮
基金项目:国家自然科学基金资助项目(61502165); 湖南省科技计划项目(2014FJ6030); 湖南省教育厅科研项目(13C527); 长沙市科技计划项目(k1403042-11); 湖南省重点学科建设项目(湘教发[2011]76号); 湖南师范大学学位与研究生教育教改课题(14JG13); 湖南师范大学教学改革项目(处发2015-13-52)
摘    要:提高文摘自动生成的准确性,能够帮助人们快速有效地获取有价值的信息。本文根据政府公文结构性强的特点,提出一种基于句子权重和篇章结构的政府公文自动文摘算法,首先通过基于游标的截取字符分句算法,对文档中句子和词语信息进行精确统计,获得对文章内容和篇章结构的基本了解;在此基础上,提出基于篇章结构的词语权重和句子权重计算方法,并根据权重计算结果对句子进行权重排序;然后,根据生成摘要的规模,筛选出一定数量的候选文摘句子;最后,对候选文摘句子进行一定的后处理,输出文摘句。实验结果表明,与同类型自动文摘算法以及Word 2003提供的自动文摘工具相比,本文提出的自动文摘算法在准确率和召回率上都有较大提高。

关 键 词:政府公文   自动文摘   词语权重   句子权重   篇章结构
  
收稿时间:2015-12-30
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号