首页 | 本学科首页   官方微博 | 高级检索  
     

基于卷积神经网络的敏感文件检测方法
引用本文:林学峰,夏元轶,郭金龙,于晓文. 基于卷积神经网络的敏感文件检测方法[J]. 计算机与现代化, 2018, 0(7): 28. DOI: 10.3969/j.issn.1006-2475.2018.07.006
作者姓名:林学峰  夏元轶  郭金龙  于晓文
基金项目:国家电网公司科技项目(SGJSXT00JFJS1700101)
摘    要:近几年,电力行业信息化建设取得了巨大成就。企业办公文件、项目方案、项目合同等涉及行业秘密的文件越来越多地在互联网中传输,导致企业级敏感文件泄露。传统敏感文件识别方法基于敏感词库进行特征检测,检测速度快,但是存在较高的漏报率和误报率。本文提出一种基于深度学习的敏感文件检测方法,引入词向量及卷积神经网络算法,实现敏感文件精准分类。本文提出的识别企业级敏感文件的检测方法优点是不再依赖于特征关键字,降低了漏报率和误报率。

关 键 词:敏感词库  词向量  卷积神经网络  深度学习  敏感文件检测  
收稿时间:2018-08-27

SensitiveFileDetectionMethodBasedonCNN
LINXue-feng,XIAYuan-yi,GUOJin-long,YUXiao-wen. SensitiveFileDetectionMethodBasedonCNN[J]. Computer and Modernization, 2018, 0(7): 28. DOI: 10.3969/j.issn.1006-2475.2018.07.006
Authors:LINXue-feng  XIAYuan-yi  GUOJin-long  YUXiao-wen
Abstract:Inrecentyears,thepowerindustryinformationconstructionhasmadegreatachievements.Moreandmoreofficedocuments,projectdocuments,projectcontractsandotherdocumentsinvolvingindustrysecrettransmitonInternet,onthetransmissionprocess,enterprise-classsensitivedocumentsmayhavebeenleaked.Traditionalsensitivedatarecognitionmethodbasedonsensitivelexiconforfeaturedetectioncangetdetectionresultquickly,butthereisalowaccuracy,highfalsenegativesrateandfalsepositivesrate.ThispaperproposesasensitivefiledetectionmethodbasedonDeepLearning.Themethodreferstowordembeddingandconvolutionneuralnetworkalgorithmtorealizetheaccurateclassificationofsensitivedocuments.Theapproachinthispapermakesenterprisesensitivefilesdetectionindependentoffeaturekeywords,andreducesthefalsenegativerateandfalsepositiverate.
Keywords:sensitivewordtable  wordembedding  convolutionneuralnetwork  deeplearning  sensitivefiledetection  
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号