首页 | 本学科首页   官方微博 | 高级检索  
     

基于离群点剔除的网络热点事件挖掘算法
引用本文:王跟成,李军. 基于离群点剔除的网络热点事件挖掘算法[J]. 计算机仿真, 2013, 30(9)
作者姓名:王跟成  李军
作者单位:1. 西藏民族学院网络信息技术中心,陕西咸阳,712082
2. 成都理工大学信息科学与技术学院,四川成都,610059
基金项目:西藏自治区教育科学"十二五"规划重点课题
摘    要:研究网络热点事件准确检测问题,收集网络文本数据中含有大量的离群点,由于离群点一些噪声数据,对网络热点事件检测产生不利影响.为提高检测正确率,提出一种采用离群点剔除的网络热点事件挖掘算法.首先通过计算数据点的密度相似度,将小于阈值的离群点剔除,降低计算复杂度和离群点的不利影响,然后采用模糊C均值聚类算法对网络文本进行聚类,发现其中的热点事件,最后通过仿真测试算法的有效性.仿真结果表明,改进算法剔除网络中的离群点,不仅提高了网络热点事件检测正确率,而且降低算法计算复杂度,加快了网络热点事件挖掘速度,更加适合于网络热点事件在线挖掘要求.

关 键 词:离群点  数据挖掘  聚类算法  网络热点事件

Network Hot Event Mining Algorithm Based on Deleting Outliers
WANG Gen-cheng , LI Jun. Network Hot Event Mining Algorithm Based on Deleting Outliers[J]. Computer Simulation, 2013, 30(9)
Authors:WANG Gen-cheng    LI Jun
Abstract:
Keywords:Outliers data  Data mining  Clustering algorithm  Network hot topic
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号