基于随机森林的文本分类研究 |
| |
引用本文: | 陈海利,孙志伟,庞龙.基于随机森林的文本分类研究[J].科技创新与应用,2014(2):55-55. |
| |
作者姓名: | 陈海利 孙志伟 庞龙 |
| |
作者单位: | 同济大学;沈阳机床股份有限公司; |
| |
摘 要: | 文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点。文本分类旨在将大量文本划分到若干子类,使得各文本子类代表不同的概念主题。文章采用了一种基于随机森林的文本分类方法。该方法来源于基于决策树的机器学习,依据文本内容的分词结果进行机器学习,将文本中信息量高的词汇提取出来作为学习维度,可以准确地对文本进行分类。由于随机森林算法Ⅲ具有高并发,快速收敛的优点,非常适合海量数据的处理。
|
关 键 词: | 决策树分类 机器学习 森林 |
本文献已被 CNKI 维普 等数据库收录! |
|