首页 | 本学科首页   官方微博 | 高级检索  
     

基于联合分类器过滤噪声的微博主题发现
作者姓名:高森  严曙  崔超远  孙丙宇  汪六三
作者单位:中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031;中国科学技术大学, 合肥 230026,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031
基金项目:中科院STS项目(KFJ-SW-STS-144);宁夏科技攻关项目(ZNNFKJ2015-04)
摘    要:伴随着互联网的广泛流行,以微博为代表的社交网络产生了大量的数据. 从这些数据中挖掘到有用的信息成为当今研究的一项重要方向. 根据微博文本的特点,本文提出来一种基于联合分类器过滤掉噪声微博,然后利用LDA模型进行主题发现. 联合分类器模型是由朴素贝叶斯、支持向量机和决策树三种模型通过简单投票机制结合构成的,实验结果联合分类器的准确度达到87%,显然这种分类方法是可行的,也是有效的.

关 键 词:支持向量机  朴素贝叶斯  决策树  联合分类器  LDA模型
收稿时间:2017-04-06
修稿时间:2017-04-26
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号