首页 | 本学科首页   官方微博 | 高级检索  
     

基于随机森林的文本分类研究
引用本文:陈海利,孙志伟,庞龙.基于随机森林的文本分类研究[J].科技创新与应用,2014(2):55-55.
作者姓名:陈海利  孙志伟  庞龙
作者单位:同济大学;沈阳机床股份有限公司;
摘    要:文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点。文本分类旨在将大量文本划分到若干子类,使得各文本子类代表不同的概念主题。文章采用了一种基于随机森林的文本分类方法。该方法来源于基于决策树的机器学习,依据文本内容的分词结果进行机器学习,将文本中信息量高的词汇提取出来作为学习维度,可以准确地对文本进行分类。由于随机森林算法Ⅲ具有高并发,快速收敛的优点,非常适合海量数据的处理。

关 键 词:决策树分类  机器学习  森林
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号