首页 | 本学科首页   官方微博 | 高级检索  
     

应用于用户兴趣建模的多文本关键词抽取研究
引用本文:寇苏玲,蔡庆生.应用于用户兴趣建模的多文本关键词抽取研究[J].计算机仿真,2007,24(2):103-105,109.
作者姓名:寇苏玲  蔡庆生
作者单位:中国科学技术大学计算机系,安徽,合肥,230027
摘    要:现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索.以单文档关键词抽取为基础,引入多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向最,建立基于关键词向量空间的用户兴趣模型.通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型.

关 键 词:关联检索  关键词抽取  用户模型  应用  用户兴趣建模  多文本  关键词抽取  研究  User  Model  Document  Multi  Extraction  用户兴趣模型  地表  召回率  准确率  提取  算法  使用  测试  主题  向量空间  权重
文章编号:1006-9348(2007)02-0103-03
修稿时间:2005-11-272006-02-14

Research on Keyword - Extraction from Multi - Document in User Model
KOU Su-ling,CAI Qing-sheng.Research on Keyword - Extraction from Multi - Document in User Model[J].Computer Simulation,2007,24(2):103-105,109.
Authors:KOU Su-ling  CAI Qing-sheng
Affiliation:Department of Computer Science, USTC, Hefei Anhui 230027 ,China
Abstract:
Keywords:Information retrieval  Keywords extraction  User model
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号