首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进的TFIDF和压缩自动编码器文本分类研究
摘    要:为了提高文本分类的分类效果和降低分类的错误率,本文将深度学习中的压缩自动编码器逐层叠加,提出基于改进的TFIDF和堆叠的压缩自动编码器SCAE(Stack Contractive Auto-Encoder)的文本分类思想,将SCAE构成深度神经网络,无监督的训练学习文本,提高特征提取的鲁棒性,并使用反向传播算法优化网络中的参数,在计算特征词的权重时,采用本文改进的TFIDF方法。通过实验将CAE和SAE(稀疏自动编码器)进行比较,采用支持向量机(SVM)分类。实验表明,单层的CAE比单层的SAE的分类性能更好,堆叠压缩编码器学习比堆叠的稀疏编码器的分类性能同样要好。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号