基于联合分类器过滤噪声的微博主题发现 |
| |
作者姓名: | 高森 严曙 崔超远 孙丙宇 汪六三 |
| |
作者单位: | 中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031;中国科学技术大学, 合肥 230026,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031,中国科学院 合肥物质科学研究院 智能机械研究所, 合肥 230031 |
| |
基金项目: | 中科院STS项目(KFJ-SW-STS-144);宁夏科技攻关项目(ZNNFKJ2015-04) |
| |
摘 要: | 伴随着互联网的广泛流行,以微博为代表的社交网络产生了大量的数据. 从这些数据中挖掘到有用的信息成为当今研究的一项重要方向. 根据微博文本的特点,本文提出来一种基于联合分类器过滤掉噪声微博,然后利用LDA模型进行主题发现. 联合分类器模型是由朴素贝叶斯、支持向量机和决策树三种模型通过简单投票机制结合构成的,实验结果联合分类器的准确度达到87%,显然这种分类方法是可行的,也是有效的.
|
关 键 词: | 支持向量机 朴素贝叶斯 决策树 联合分类器 LDA模型 |
收稿时间: | 2017-04-06 |
修稿时间: | 2017-04-26 |
|
| 点击此处可从《计算机系统应用》浏览原始摘要信息 |
|
点击此处可从《计算机系统应用》下载免费的PDF全文 |
|