首页 | 本学科首页   官方微博 | 高级检索  
     

网页内容过滤技术中的特征提取
引用本文:吕宏伟,唐小力,王申. 网页内容过滤技术中的特征提取[J]. 计算机工程与应用, 2004, 40(31): 145-146
作者姓名:吕宏伟  唐小力  王申
作者单位:西安武警工程学院训练部,西安,710086;西安武警工程学院训练部,西安,710086;西安武警工程学院训练部,西安,710086
摘    要:有害的网络内容日益猖獗,为封锁色情网页,论文通过统计和分析,主要从四个方面提取色情网页的特征:网页的布局,因特网内容选择平台(PICS)等级评定应用,暗示性条文和文档内容。从这四个方面的特征能几乎完全区分色情网页和非色情网页,该基本框架也适用于过滤网上除色情以外的其它不益内容。

关 键 词:特征  网页的布局  PICS  暗示性条文  语义识别
文章编号:1002-8331-(2004)31-0145-02

Characteristic Extraction in Web Content Filtering
Abstract:With the proliferation of harmful internet content ,in this paper characteristic of pornographic Web pages are extracted from four aspects to block pornographic Web pages:page layout format,platform for internet content selection(PICS),indicative terms and text-content.Nonpornographic and pornographic Web pages can be distinguished almost completely,this general framework is adaptable for filtering other objectionable Web material.
Keywords:feature  page layout format  platform for internet content selection(PICS)  indicative terms   text-content identi-fication
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号