首页 | 本学科首页   官方微博 | 高级检索  
     

基于Single-Pass的网络舆情热点发现算法
引用本文:格桑多吉,乔少杰,韩楠,张小松,杨燕,元昌安,康健.基于Single-Pass的网络舆情热点发现算法[J].电子科技大学学报(自然科学版),2015,44(4):599-604.
作者姓名:格桑多吉  乔少杰  韩楠  张小松  杨燕  元昌安  康健
作者单位:1. 西藏大学藏文信息技术研究中心 拉萨 850000
2. 西南交通大学信息科学与技术学院 成都 610031
3. 西南交通大学生命科学与工程学院 成都 610031
4. 电子科技大学大数据研究中心 成都 611731
5. 广西师范学院科学计算与智能信息处理广西高校重点实验室 南宁 530023
基金项目:国家自然科学基金(61100045;61165013);高等学校博士学科点专项科研基金(20110184120008);中国博士后科学基金特别资助项目(201104697);教育部人文社会科学研究青年基金(14YJCZH046);中央高校基本科研业务费专项资金(2682013BR023);科学计算与智能信息处理广西高校重点实验室开放课题资助(GXSCIIP201407);四川省教育厅资助科研项目
摘    要:考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。

关 键 词:舆情分析    single-pass    文本聚类    话题发现

An Internet Public Opinion Hotspot Detection Algorithm Based on Single-Pass
GESANG Duoji,QIAO Shao-jie,HAN Nan,ZHANG Xiao-song,YANG Yan,YUAN Chang-an,KANG Jian.An Internet Public Opinion Hotspot Detection Algorithm Based on Single-Pass[J].Journal of University of Electronic Science and Technology of China,2015,44(4):599-604.
Authors:GESANG Duoji  QIAO Shao-jie  HAN Nan  ZHANG Xiao-song  YANG Yan  YUAN Chang-an  KANG Jian
Abstract:
Keywords:public opinion analysis  single-pass  text clustering  topic detection
本文献已被 万方数据 等数据库收录!
点击此处可从《电子科技大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《电子科技大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号