首页 | 本学科首页   官方微博 | 高级检索  
     

基于组块的中文自动文摘系统研究
引用本文:索红光,曹淑英.基于组块的中文自动文摘系统研究[J].计算机系统应用,2007,16(3):97-100.
作者姓名:索红光  曹淑英
作者单位:中国石油大学(华东)计算机与通信工程学院,山东东营,257061
摘    要:传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.

关 键 词:自然语言处理  文本组块  自动文摘  统计方法  向量空间模型  文本组块  中文  自动  文摘系统  研究  Chunk  Based  System  Automatic  Abstracting  Chinese  系统生成  比较  结果  实验  评价方法  标准  词语构造  相关  规则  词性标注

Research on the Chinese Automatic Abstracting System Based on Chunk
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号