首页 | 本学科首页   官方微博 | 高级检索  
     

基于组合-卷积神经网络的中文新闻文本分类
引用本文:张昱,刘开峰,张全新,王艳歌,高凯龙.基于组合-卷积神经网络的中文新闻文本分类[J].电子学报,2021,49(6):1059-1067.
作者姓名:张昱  刘开峰  张全新  王艳歌  高凯龙
作者单位:北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室,北京100044;中国矿业大学深部岩土力学与地下工程国家重点实验室,北京100083;北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室,北京100044;北京理工大学计算机科学与技术学院,北京100081
摘    要:目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型.

关 键 词:自然语言处理  词向量  组合-卷积神经网络  中文新闻  文本分类

A Combined-Convolutional Neural Network for Chinese News Text Classification
ZHANG Yu,LIU Kai-feng,ZHANG Quan-xin,WANG Yan-ge,GAO Kai-long.A Combined-Convolutional Neural Network for Chinese News Text Classification[J].Acta Electronica Sinica,2021,49(6):1059-1067.
Authors:ZHANG Yu  LIU Kai-feng  ZHANG Quan-xin  WANG Yan-ge  GAO Kai-long
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号