首页 | 本学科首页   官方微博 | 高级检索  
     

不平衡数据集文本多分类深度学习算法
引用本文:王德志,梁俊艳.不平衡数据集文本多分类深度学习算法[J].计算机工程与设计,2021,42(9):2501-2508.
作者姓名:王德志  梁俊艳
作者单位:华北科技学院计算机学院,河北廊坊065201;华北科技学院图书馆,河北廊坊065201
摘    要:针对文本多分类算法中,由于不平衡数据集产生的小样本分类数据准确率低问题,提出基于轮廓系数动态K-means聚类的文本多分类混合式均分聚类采样算法.在不平衡数据集中针对小样本数据集利用聚类簇进行等比例过采样,针对大样本数据集利用聚类簇进行欠采样.基于微博灾害数据集,设计文本卷积神经网络,对该算法进行实验验证与分析,实验结果表明,该算法能够有效提升文本不平衡数据集的准确率和F1值,较好解决了不平衡文本数据集分类问题.

关 键 词:不平衡数据集  情感分类  文本多分类  聚类  深度学习

Text multi-classification deep learning algorithm based on unbalanced data set
WANG De-zhi,LIANG Jun-yan.Text multi-classification deep learning algorithm based on unbalanced data set[J].Computer Engineering and Design,2021,42(9):2501-2508.
Authors:WANG De-zhi  LIANG Jun-yan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号