首页 | 本学科首页   官方微博 | 高级检索  
     

基于认证用户信息的微博用户类型识别方法
引用本文:黄磊,李寿山,王晶晶.基于认证用户信息的微博用户类型识别方法[J].计算机科学与探索,2015(6).
作者姓名:黄磊  李寿山  王晶晶
作者单位:苏州大学 计算机与科学技术学院,江苏 苏州,215006
摘    要:微博用户可以分为个人用户和非个人用户两种类型。在微博中对这两种用户类型进行自动分类是智能广告、用户个性分析等应用的一项基本任务。针对该任务,提出了一种基于机器学习的自动分类方法。该方法的特色在于,不需要人工标注样本,而是利用微博中认证用户类型的语料作为训练样本构建分类器,用于对非认证用户类型进行分类。具体实现中,将用户名和用户发表的微博文本作为表示用户的样本,使用基于最大熵算法进行用户分类。实验表明这种利用认证用户对非认证用户进行类型分类的方法能够获得较好的效果。

关 键 词:自然语言处理  微博  用户分类  认证

User-Type Classification in Micro-Blog Based on Information of Authenticated User
HUANG Lei,LI Shoushan,WANG Jingjing.User-Type Classification in Micro-Blog Based on Information of Authenticated User[J].Journal of Frontier of Computer Science and Technology,2015(6).
Authors:HUANG Lei  LI Shoushan  WANG Jingjing
Abstract:
Keywords:natural language processing  micro-blog  user-type classification  authentication
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号