首页 | 本学科首页   官方微博 | 高级检索  
     

基于多因素的中文文本主题自动抽取方法
引用本文:刘金岭,谈芸,李健普,袁娜.基于多因素的中文文本主题自动抽取方法[J].计算机技术与发展,2010,20(7):72-75,79.
作者姓名:刘金岭  谈芸  李健普  袁娜
作者单位:淮阴工学院,计算机工程学院,江苏淮安223003
基金项目:淮安市科技项目,江苏省大学生实践创新训练项目 
摘    要:提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系.根据概念间的相互关系,对同义概念进行语义归并和上下位概念进行语义聚焦.对于给定的文本,先进行特征词抽取进而生成代表主题概念的重要词汇.综合语句所在位置、语句中的标题、语句中所含重要词汇等多因素构造语句权值表达式,在此基础上,采用主题句选择算法保证每一个主题句被选中,同时解决了主题句的去重问题.实验结果表明,该方法具有较高的抽准率.

关 键 词:主题句  主题抽取  文本主题  重要词汇  语句权值

Automatic Extraction Method of Chinese Text Theme Based on Multi-Factor
LIU Jin-ling,TAN Yun,LI Jian-pu,YUAN Na.Automatic Extraction Method of Chinese Text Theme Based on Multi-Factor[J].Computer Technology and Development,2010,20(7):72-75,79.
Authors:LIU Jin-ling  TAN Yun  LI Jian-pu  YUAN Na
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号