首页 | 本学科首页   官方微博 | 高级检索  
     

基于SOM聚类的微博话题发现
引用本文:宋莉娜,冯旭鹏,刘利军,黄青松. 基于SOM聚类的微博话题发现[J]. 计算机应用研究, 2018, 35(3)
作者姓名:宋莉娜  冯旭鹏  刘利军  黄青松
作者单位:昆明理工大学信息工程与自动化学院,昆明理工大学教育技术与网络中心,昆明理工大学信息工程与自动化学院,昆明理工大学信息工程与自动化学院
基金项目:国家自然科学基金资助项目(81360230,81560296).
摘    要:随着微博用户的增多,微博平台的信息更新频繁,针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。首先从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题;然后,采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能够有效的发现话题。实验表明,该算法较传统文本聚类算法的综合指标F值有明显提高。

关 键 词:话题发现  词向量模型  文本相似度  短文本  SOM聚类
收稿时间:2016-11-16
修稿时间:2017-01-05

Microblog hot-topic detection based on SOM clustering
SONG Lin,FENG Xupeng,LIU Lijun and HUANG Qingsong. Microblog hot-topic detection based on SOM clustering[J]. Application Research of Computers, 2018, 35(3)
Authors:SONG Lin  FENG Xupeng  LIU Lijun  HUANG Qingsong
Affiliation:Faculty of Information Engineering and Automation,Kunming University of Science and Technology,,,
Abstract:
Keywords:Topics detection   Word vector model   Texts similarity   Short text   SOM clustering
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号