首页 | 本学科首页   官方微博 | 高级检索  
     

Internet网络新闻文本自动摘要的研究
引用本文:官礼和. Internet网络新闻文本自动摘要的研究[J]. 计算机工程与设计, 2007, 28(14): 3518-3520,F0003
作者姓名:官礼和
作者单位:重庆交通大学,信息与计算科学研究所,重庆,400074
基金项目:重庆交通学院高层次人才启动基金
摘    要:给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法.针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要.最后实验分析表明效果较好.

关 键 词:自然语言处理  自动摘要  分词  断句  权重  平滑处理  Internet  网络新闻  文本自动摘要  研究  network  text  news  abstract  automatic  效果  分析表  实验  质量  文字流  平滑处理  比例  大小  权值  词汇  综合
文章编号:1000-7024(2007)14-3518-03
修稿时间:2006-06-30

Research on automatic abstract of news text of Internet network
GUAN Li-he. Research on automatic abstract of news text of Internet network[J]. Computer Engineering and Design, 2007, 28(14): 3518-3520,F0003
Authors:GUAN Li-he
Affiliation:Institute of Information and Calculation Science, Chongqing Jiaotong University, Chongqing 400074, China
Abstract:The basic thinking and step of the automatic abstract of the news' text is provided,and the algorithm of words frequency and breaking sentences is discussed.To contrapose 4 kinds of form characteristics of the news' text in the automatic abstract,a set of new automatic abstract schemes are put forward: First,using these form characteristics,different weights are given to the vocabulary and sentence.And then,some sentences are selected according to the proportion definitely and the size of weights.Moreover,dealing with them smoothly.And last,generating automatic abstract,which is of some quality and fluent.
Keywords:natural language processing  automatic abstract  words frequency  breaking sentences  weights  dealing with levelly and smoothly
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号