首页 | 本学科首页   官方微博 | 高级检索  
     

互联网中非法文本特征分析及其属性预选取新方法
引用本文:张永奎,李东艳.互联网中非法文本特征分析及其属性预选取新方法[J].计算机应用,2004,24(4):113-115.
作者姓名:张永奎  李东艳
作者单位:山西大学,计算机科学系,山西,太原,030006
基金项目:山西省回国留学人员基金(2002004)
摘    要:针对互联网中含不良内容的文本带来的信息安全问题,分析总结它们出现的特征,结合内容过滤技术,提出对此类文本的预处理方法,即带标点符号属性预选取方法。方法充分利用此类信息中词出现的特征,在属性预选取中,将标点符号作为潜在特征词的触发信息,进行文本预选属性集的提取。实验结果表明,该方法对增加合法文本与非法文本的区分度有较明显的效果。

关 键 词:内容过滤  信息安全  非法文本  属性预选取
文章编号:1001-9081(2004)04-0113-02

Analysis of Illegitimate Contents in Web and a New Feature Pre-selection Method
ZHANG Yong-kui,LI Dong-yan.Analysis of Illegitimate Contents in Web and a New Feature Pre-selection Method[J].journal of Computer Applications,2004,24(4):113-115.
Authors:ZHANG Yong-kui  LI Dong-yan
Abstract:Contents containing ill information in Web have brought new problems to information security. Using content filter technology,a new feature pre-selection method has been put forward for farther feature selection. Considering the format of the word in the contents,the method uses punctuations as the trigger extracting the latent word. Results show that the method has prominent effect in differentiating legit and illegitimate content.
Keywords:content filter  information security  illegitimate content  feature pre-selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号