首页 | 本学科首页   官方微博 | 高级检索  
     

新的关键字提取算法研究
引用本文:高俊波,栾翠菊,王晓峰.新的关键字提取算法研究[J].计算机工程与设计,2008,29(3):765-767.
作者姓名:高俊波  栾翠菊  王晓峰
作者单位:上海海事大学,信息工程学院,上海,200135
基金项目:上海市重点学科建设项目 , 上海市教委资助项目
摘    要:传统的关键字提取算法往往是基于高频词提取的,但文档中的关键字往往并不都是高频词,因此还需要从非高频词集中找出关键字.把一篇文档抽象为一个图:结点表示词语,边表示词语的同现关系;并基于文档的这种拓扑结构,提出了一种新的关键字提取算法,并和传统的关键字提取算法作了比较,在精确率,覆盖率方面均有不错的效果.

关 键 词:文本检索  关键字提取  偏向度  聚类
文章编号:1000-7024(2008)03-0765-03
收稿时间:2007-03-07
修稿时间:2007年3月7日

New keyword extraction research
GAO Jun-bo,LUAN Cui-ju,WANG Xiao-feng.New keyword extraction research[J].Computer Engineering and Design,2008,29(3):765-767.
Authors:GAO Jun-bo  LUAN Cui-ju  WANG Xiao-feng
Abstract:Most of keyword extraction systems are utilized the high frequency for extracting keywords.Since the keywords of document are often not high-frequency words,we need to find keywords from set of non-high-frequency words.A document can be viewed as a graph: node can represent term and edge can represent the co-occurrence relation between terms.Based on this topology of document,a new keyword extraction algorithm is proposed and the traditional algorithms is compared.The experiment results show that our algorithm gets a certain advantage over the traditional algorithm in precision and coverage.
Keywords:text search  keyword extraction  deflection  clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号