首页 | 本学科首页   官方微博 | 高级检索  
     

一种针对不良主题的文本过滤方法
引用本文:孙登林,李生红,荆涛,刘功申.一种针对不良主题的文本过滤方法[J].信息安全与通信保密,2008(2):92-93.
作者姓名:孙登林  李生红  荆涛  刘功申
作者单位:上海交通大学内容安全实验室,上海,200240
基金项目:国家自然科学基金 , 教育部跨世纪优秀人才培养计划
摘    要:针对不良文本的过滤问题,文章提出了一种基于SVM分类器改进的文本过滤方法。该方法将传统的基于词语的分类方法改为基于词语元组的分类,增强了特征项的分辨率,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率。

关 键 词:SVM  文本过滤  VSM  N-gram
文章编号:1009-8054(2008)02-0092-02
修稿时间:2007年8月1日

A Text Filter Method against Chinese Vicious-topic Information
SUN Deng-lin,LI Sheng-hong,JING Tao,LIU Gong-shen.A Text Filter Method against Chinese Vicious-topic Information[J].China Information Security,2008(2):92-93.
Authors:SUN Deng-lin  LI Sheng-hong  JING Tao  LIU Gong-shen
Affiliation:SUN Deng-lin; LI Sheng-hong; JING Tao; LIU Gong-shen (Information Security Lab; Shanghai Jiao Tong University; Shanghai 200240; China);
Abstract:Concerning Chinese vicious-topic information text filtering problems£this paper presents an improved text filtering method based on SVM classifier. Through replacing filtering method based on words with method based on n-gram, feature items can be distinguished from different classes more effectively. The experimental results indicate that, this method is of both higher precision rate and recall rate as compared to traditional methods.
Keywords:SVM  text filtering  VSM N-gram
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号