首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于TFIDF的网络聊天关键词提取算法
引用本文:许晓昕,李安贵.一种基于TFIDF的网络聊天关键词提取算法[J].计算机技术与发展,2006,16(3):122-124.
作者姓名:许晓昕  李安贵
作者单位:北京科技大学,应用科学学院数力系,北京,100083
摘    要:随着Internet的普及,即时通讯软件(IM software)也就是网络聊天软件越来越多地服务于人们的日常生活。利用聊天双方的聊天信息来提供更好的服务成为研究者们的重要课题,而如何提取聊天文本中的关键词又成为此类研究的重点。聊天文本不同于普通的文章,它是一种动态输入的文本,对于这种文本,传统的TFIDF算法存在着缺陷。文中针对传统TFIDF在处理此类文本时的不足之处,利用一个按主题分类的历史缓存来提高TFIDF算法对于这类文本的处理能力。

关 键 词:文本挖掘  即时通讯软件  关键词提取

A New TFIDF- Based Chat Stream Keyword Extraction Algorithm
XU Xiao-xin,LI An-gui.A New TFIDF- Based Chat Stream Keyword Extraction Algorithm[J].Computer Technology and Development,2006,16(3):122-124.
Authors:XU Xiao-xin  LI An-gui
Abstract:
Keywords:TFIDF
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号