首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的基于质心的文本分类算法
引用本文:陈震,吴斌,沈崇玮,张忠辉,王柏. 一种改进的基于质心的文本分类算法[J]. 计算机应用与软件, 2013, 0(1): 43-47,54
作者姓名:陈震  吴斌  沈崇玮  张忠辉  王柏
作者单位:北京邮电大学计算机学院
基金项目:国家自然科学基金项目(61074128,60905025)
摘    要:文本分类是数据挖掘与信息检索领域的热点话题,近年来迅速发展。基于质心的方法是一种建模迅速且效果较好的文本分类方法,许多学者对该方法进行了深入研究并提出改进策略,不断提高算法效果。提出一种新的动态调整质心位置算法,该算法根据训练集中的每个样本文本动态的调整质心位置。并且针对海量数据处理瓶颈,运用当前两种并行计算框架MapReduce和BSP,提出了算法的并行策略。通过与其它算法在5种不同数据集中的对比实验,证明该方法确有较准确的分类效果。

关 键 词:文本分类  质心向量  动态调整  并行计算

AN IMPROVED TEXT CATEGORISATION ALGORITHM BASED ON CENTROID
Chen Zhen Wu Bin Shen Chongwei Zhang Zhonghui Wang Bai. AN IMPROVED TEXT CATEGORISATION ALGORITHM BASED ON CENTROID[J]. Computer Applications and Software, 2013, 0(1): 43-47,54
Authors:Chen Zhen Wu Bin Shen Chongwei Zhang Zhonghui Wang Bai
Affiliation:Chen Zhen Wu Bin Shen Chongwei Zhang Zhonghui Wang Bai(School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号