首页 | 本学科首页   官方微博 | 高级检索  
     

基于组块的中文自动文摘系统研究
引用本文:索红光,曹淑英. 基于组块的中文自动文摘系统研究[J]. 计算机系统应用, 2007, 16(3): 97-100
作者姓名:索红光  曹淑英
作者单位:中国石油大学(华东)计算机与通信工程学院,山东东营,257061;中国石油大学(华东)计算机与通信工程学院,山东东营,257061
摘    要:传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.

关 键 词:自然语言处理  文本组块  自动文摘  统计方法  向量空间模型

Research on the Chinese Automatic Abstracting System Based on Chunk
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号