首页 | 本学科首页   官方微博 | 高级检索  
     

结合TFIDF的Self-Attention-Based Bi-LSTM的垃圾短信识别
引用本文:吴思慧,陈世平.结合TFIDF的Self-Attention-Based Bi-LSTM的垃圾短信识别[J].计算机系统应用,2020,29(9):171-177.
作者姓名:吴思慧  陈世平
作者单位:上海理工大学 光电信息与计算机工程学院, 上海 200093;复旦大学 上海市数据科学重点实验室, 上海 201203
基金项目:国家自然科学基金(61472256,61170277,61003031);上海重点科技攻关项目(14511107902);上海市工程中心建设项目(GCZXL14014);上海市一流学科建设项目(S1201YLXK,XTKX2021.);上海市数据科学重点实验室开发课题(201609060003);沪江基金(A14006);沪江基金研究基地专项(C14001)
摘    要:随着手机短信成为人们日常生活交往的重要手段,垃圾短信的识别具有重要的现实意义.针对此提出一种结合TFIDF的self-attention-based Bi-LSTM的神经网络模型.该模型首先将短信文本以词向量的方式输入到Bi-LSTM层,经过特征提取并结合TFIDF和self-attention层的信息聚焦获得最后的特征向量,最后将特征向量通过Softmax分类器进行分类得到短信文本分类结果.实验结果表明,结合TFIDF的self-attention-based Bi-LSTM模型相比于传统分类模型的短信文本识别准确率提高了2.1%–4.6%,运行时间减少了0.6 s–10.2 s.

关 键 词:垃圾短信  文本分类  self-attention  Bi-LSTM  TFIDF
收稿时间:2019/12/12 0:00:00
修稿时间:2020/1/3 0:00:00

Spam Message Recognition Based on TFIDF and Self-Attention-Based Bi-LSTM
WU Si-Hui,CHEN Shi-Ping.Spam Message Recognition Based on TFIDF and Self-Attention-Based Bi-LSTM[J].Computer Systems& Applications,2020,29(9):171-177.
Authors:WU Si-Hui  CHEN Shi-Ping
Affiliation:School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China; Shanghai Key Laboratory of Data Science, Fudan University, Shanghai 201203, China
Abstract:
Keywords:spam message  text categorization  self-attention  Bi-LSTM  TFIDF
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号