首页 | 本学科首页   官方微博 | 高级检索  
     

面向离散文本舆情分析的分聚类方案
引用本文:李海燕,李生红,张月国. 面向离散文本舆情分析的分聚类方案[J]. 信息安全与通信保密, 2010, 0(2): 65-67
作者姓名:李海燕  李生红  张月国
作者单位:1. 上海交通大学,电子工程系,上海,200240
2. 上海交通大学,电子工程系,上海,200240;上海交通大学,信息安全学院,上海,200240
基金项目:国家自然科学基金资助项目,国家重大基础研究973计划项目,教育部新世纪优秀人才支持计划项目,上海市曙光学者基金 
摘    要:离散文本已经成为一种占据重要地位的舆情信息表现形式,根据离散文本的特点,提出基于特征概念网的离散文本舆情信息的分聚类框架,在此基础上给出分聚类方案。在聚类算法中,运用了遗传算法的全局并行搜索能力、k—means的高效局部聚类能力和小生境的保持种群多样性抑制漂移能力;在分类算法中,先将训练文本库进行类内聚类成子类,对子类构建特征概念网以生成替代该子类的文本,再用KNN算法进行分类。最后结合舆情分析进一步提出了可用的改进方案。

关 键 词:离散文本  特征概念网  小生境遗传算法  KNN分类  舆情分析

Discrete Text Classification and Clustering for Public Opinion Analysis
LI Hai-yan,LI Sheng-hong,ZHANG Yue-guo. Discrete Text Classification and Clustering for Public Opinion Analysis[J]. China Information Security, 2010, 0(2): 65-67
Authors:LI Hai-yan  LI Sheng-hong  ZHANG Yue-guo
Affiliation:LI Hai-yana,LI Sheng-honga,b,ZHANG Yue-guoa,b (aSchool of Electronic,Information , Electrical Engineering,bSchool of Information Security,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:Discrete text has occupied an important position in public-opinion information. In order to analyze public opinion efficiently, this paper proposes a kind of high-performance classification and clustering algorithm according to characteristics of network discrete text based on characteristic concept network. This clustering algorithm integrates the efficiency of k-means, the parallel global search ability of genetic algorithms and the capability to maintain population diversity of Niche method to cluster te...
Keywords:discrete text  characteristic concept network  Niche genetic algorithms  KNN classification  public opinion analysis  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号