首页 | 本学科首页   官方微博 | 高级检索  
     

面向网络论坛的高质量主题发现
引用本文:陈友,程学旗,杨森. 面向网络论坛的高质量主题发现[J]. 软件学报, 2011, 22(8): 1785-1804. DOI: 10.3724/SP.J.1001.2011.03857
作者姓名:陈友  程学旗  杨森
作者单位:1. 中国科学院计算技术研究所,北京100190;中国科学院研究生院,北京 100049
2. 中国科学院计算技术研究所,北京,100190
基金项目:国家自然科学基金(60933005,60903139); 国家高技术研究发展计划(863)(2007AA01Z438)
摘    要:提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0领域得到应用,例如,博客、社会网络平台等.

关 键 词:网络论坛  高质量  特征选择  特征抽取  分类
收稿时间:2009-08-27
修稿时间:2010-03-04

Finding High Quality Threads in Web Forums
CHEN You,CHENG Xue-Qi and YANG Sen. Finding High Quality Threads in Web Forums[J]. Journal of Software, 2011, 22(8): 1785-1804. DOI: 10.3724/SP.J.1001.2011.03857
Authors:CHEN You  CHENG Xue-Qi  YANG Sen
Affiliation:CHEN You1,2,CHENG Xue-Qi1,YANG Sen1,2 1(Institute of Computing Technology,The Chinese Academy of Sciences,Beijing 100190,China) 2(Graduate University,Beijing 100049,China)
Abstract:This paper presents a general detection framework,and develops a variety of content and structure features to find high quality threads.The feature selection algorithm,which is a combination of genetic algorithm,Tabu search and a machine learning algorithm,is designed to attain a better assessment of key features.In this paper,an experiment is done that focuses on the Tencent Message Boards.The experimental results,obtained from a large scale evaluation of over thousands of real web forum threads and user r...
Keywords:Web forum  high quality  feature selection  feature extraction  classification  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号