用于色情网页过滤中的KNN算法改进 |
| |
引用本文: | 康进峰,王国营,梁春迎,谭晓贞. 用于色情网页过滤中的KNN算法改进[J]. 计算机安全, 2009, 0(9): 17-19,22 |
| |
作者姓名: | 康进峰 王国营 梁春迎 谭晓贞 |
| |
作者单位: | 1. 解放军信息工程大学,电子技术学院,河南,郑州,450004 2. 海军司令部航空管制处,北京,100071 |
| |
摘 要: | 针对互联网日益泛滥的色情信息,分析了向量空间模型中KNN算法,并对它的缺陷进行了改进,将其运用于色情网页过滤中,提出了一种色情网页过滤解决方案。该方法首先对特征项的选取和权重计算的方法进行了优化,然后使用改进后KNN算法进行网页分类。实验表明,通过改进,有效地降低了向量空间的维数,提高了网页分类的精度和速度,能有效地识别并过滤色情网页。
|
关 键 词: | KNN算法 向量空间模型 特征选择 权重计算 色情网页过滤 |
A Improved KNN Algorithm Applied to Pornographic Web Pages Filtering |
| |
Abstract: | Owing to pornographic information increasingly overruns on Internet,KNN algorithm used in vector space model is analyzed and improved.By applying it in pornographic web page filtering,a new model for page filtering is designed.The method improves feature vectors selection and weight computing,then classifies the web page using KNN algorithm,Experiments prove this method improves the classify speed and precision,narrow down vector space,and can realizes efficient pornographic web page filtering. |
| |
Keywords: | KNN algorithm Vector space model Feature selection Weight algorithm Pornographic webpage filtering |
本文献已被 维普 万方数据 等数据库收录! |
|