首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
网页内容过滤技术中的特征提取   总被引:2,自引:0,他引:2  
有害的网络内容日益猖獗,为封锁色情网页,论文通过统计和分析,主要从四个方面提取色情网页的特征:网页的布局,因特网内容选择平台(PICS)等级评定应用,暗示性条文和文档内容。从这四个方面的特征能几乎完全区分色情网页和非色情网页,该基本框架也适用于过滤网上除色情以外的其它不益内容。  相似文献   

2.
基于内容的网页特征提取   总被引:6,自引:1,他引:5  
文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。  相似文献   

3.
针对互联网日益泛滥的色情信息,分析了向量空间模型中KNN算法,并对它的缺陷进行了改进,将其运用于色情网页过滤中,提出了一种色情网页过滤解决方案。该方法首先对特征项的选取和权重计算的方法进行了优化,然后使用改进后KNN算法进行网页分类。实验表明,通过改进,有效地降低了向量空间的维数,提高了网页分类的精度和速度,能有效地识别并过滤色情网页。  相似文献   

4.
基于Web内容和日志挖掘的个性化网页推荐系统   总被引:1,自引:0,他引:1  
目前的网页推荐服务大都是基于对查询关键词的匹配来实现的,缺乏自动提取用户兴趣并进行推荐的能力。本文设计和实现了一个基于Web内容和日志挖掘的个性化网页推荐系统Webpage-recom- mender,该系统采用特征提取技术,能自动识别用户的兴趣,并主动推荐和筛选与用户兴趣主题相关的网页。实验结果证明了该系统的有效性。  相似文献   

5.
行动     
《信息网络安全》2007,(6):66-75
北京利用手机传播淫秽信息案北京警方在工作中发现,北京某电信技术有限公司涉嫌利用手机WAP网页传播淫秽信息。该公司在其收费网络浏览栏目上大肆张贴含有淫秽色情内容的小说和图片。警方在联通公司技术支持和大力配合下,随即展开调查工作,对该WAP网页发布的所有内容进行了浏览、查阅,并提取了相关证据。  相似文献   

6.
在网页文本信息自动采集的实际应用中,网页检索采集到的资源存在着大量与网页主题内容无关的"噪音"信息,本文主要内容是研究基于DOM树的网页去噪技术,通过对网页结构的转化,将网页转化成DOM树,在此基础上过滤掉网页噪音信息,提取网页文本的正文内容。  相似文献   

7.
网络卫士     
当你外出时,怎样才能监测和控制孩子在浏览Internet时所看到的内容?Web过滤软件可以帮你解决这一难题,它能保护儿童免受Internet上泛滥成灾的色情网页和其他可疑内容的污染。 在本次评测中,我们测试了几个最流行的Web过滤软件包,目的是考察它们对Internet上的色情内容和其他不良内容(例如与毒品有关的信息,敌对的宣传,以及提倡暴力的内容等)的过滤效果如何。我们在一组以书签形式记录的测试站点和新闻组站点上对这些软件包进行了测  相似文献   

8.
无论是门户网站还是如今流行的B/S结构的企业MIS,都是靠网页来展现它的内容、与用户进行交流。网页可以简单地描述为"内容 表现",CSS(Cascading Style Sheet,级联样式表)是最好的网页"表现"技术,它使用一套完整而且灵活的规则,将网页的内容和表现方法彻底分离,利用它能设计出具有复杂布局的精美网页,并且代码简洁、干净、易于调整和维护,为网页设计人员和维护人员节省大量的时间和精力,提高企业的经济效益。  相似文献   

9.
首先将垃圾网页特征分为两个不同的视图, 即基于内容特征的视图和基于链接特征的视图, 利用典型相关分析及其相关改进方法进行特征提取, 生成两组新的特征; 再对新生成的两视图特征采用不同组合方式产生单视图数据, 并用这组数据作为训练数据构建分类算法。实验结果表明, 将垃圾网页看成两视图数据, 并应用多视图典型相关分析技术, 可有效提高垃圾网页的识别精度。  相似文献   

10.
Media Detective是一款非常犀利的媒体文件查找工具,软件内置了识别图片和影片的Skin-tone技术,可以自动扫描指定范围内的多媒体文件,包括图片,视频,音频,文档,网页历史。如果发现色情内容或无用的垃圾文件,你可以立即将其清除出去。当然,你还可以顺带着使用这款软件浏览图片或是观看影看,功能绝对是物超所值。  相似文献   

11.
基于正文结构和长句提取的网页去重算法*   总被引:3,自引:0,他引:3  
针对网页重复的特点和网页正文的结构特征,提出了一种动态的、层次的、鲁棒性强的网页去重算法。该方法通过将网页正文表示成正文结构树的形式,实现了一种动态的特征提取算法和层次指纹的相似度计算算法。特征提取利用长句提取算法保证了强鲁棒性。实验证明,该方法对镜像网页和近似镜像网页都能进行准确的检测。  相似文献   

12.
在六一国际儿童节就要到来的时候,安全内容和应用交付的提供商B l u eCoat系统公司宣布推出K9网络保护方案。这是一种新型的,可以帮助家长对家庭使用互联网进行控制的免费网页过滤方案。K9网络保护方案可以阻止超过55种不同类别的不良内容,包括色情内容、过激言论、宣扬暴力和赌博的站点,从而使家长可以监控未成年子女的上网行为,确保他们有效屏蔽攻击性的和潜在的危险网站。K9网络保护方案同样采用了BlueCoat的全球企业和政府机构用户所采用的企业级网页过滤技术,经过简单包装和优化,成为支持家庭用Windows2000或者WindowsXP系统的可…  相似文献   

13.
病毒急救站     
《电脑迷》2008,(23):68-68
病毒名称:图片杀手病毒类型:数据破坏类病毒病毒目的:破坏系统设置,感染程序图片病人:弹出色情网页信息今天帮助一个朋友检测系统,发现当连接到互联网以后,浏览器会自动打开大量的色情网页。除此以外我还发现,系统中所有的图片都被病毒破坏,而且除C盘之外其他磁盘的程序也被感染。  相似文献   

14.
网络淫秽色情犯罪的法律控制   总被引:1,自引:0,他引:1  
网上传播淫秽物品的行为一般表现为上载,下载淫秽色情物品和建立展示淫秽物品的超链接点。上载淫秽物品是指行为人通过网络将淫秽色情物品载入互联网的行为。例如行为人建立网站或者自己的个人主页。然后,通过将淫秽色情物品上载至网页中供他人浏览或者观看。下载淫秽色情物品有两种形式,一种是指行为人将淫秽色情物品从互联网发送到不特定人的电子邮件中,当用户打开自己的电子邮件时就能浏览到这些淫秽色情物品的行为。  相似文献   

15.
动态网贞技术是基于内容数据库和内容管理软件的网页生成技术,由于它可以提高时效性,减少差错,绝大多数网站都采用这一技术实现内容更新。采用动态网页技术时,内容管理软件读取内容数据库,经过计算后,对预先编制的网页框架进行填充,生成所需的网页,响应浏览请求。当网页的结构比较复杂时,由于数据库查询和计算的复杂程度增加,  相似文献   

16.
随着Web技术的迅速发展,动态和个性化网页的比重日益增加,而传统缓存一般只适用于静态内容,难以减少获取动态网页所需的流量和延时代价。为了更有效地分发动态网页,人们提出了各种动态内容加速方案。文中研究了典型的动态网页分发加速方法,并对相关的加速技术进行了分析和比较。针对ESI和CDE这两种技术的优缺点,提出基于共享片段的动态网页分发加速模型。实验结果表明,与ESI和CDE相比,该模型可以节省更多的带宽,减少更多的延时。  相似文献   

17.
随着Web技术的迅速发展,动态和个性化网页的比重日益增加,而传统缓存一般只适用于静态内容,难以减少获取动态网页所需的流量和延时代价.为了更有效地分发动态网页,人们提出了各种动态内容加速方案.文中研究了典型的动态网页分发加速方法,并对相关的加速技术进行了分析和比较.针对ESI和CDE这两种技术的优缺点,提出基于共享片段的动态网页分发加速模型.实验结果表明,与ESI和CDE相比,该模型可以节省更多的带宽,减少更多的延时.  相似文献   

18.
互联网上淫秽色情内容呈现的泛滥之势,正在引起广大人民群众的强烈不满。据调查.全世界约有色情网站420万家,含色情网页3.72亿页,占总网页数的12%。而目前网民中18至24岁的年轻人约占34%,18岁以下的占19%左右,25至30岁的约占17%,网民结构正呈现低龄化趋势。黄色网站不仅毒害了广大青少年.就是对成年人也是一个危  相似文献   

19.
针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于规则匹配和随机森林方法的集成钓鱼网站检测方法。根据网页协议对网站进行预过滤,若判定其为钓鱼网站则省略后续特征提取步骤。否则以文本关键字置信度,网页子链接置信度,钓鱼类词汇相似度以及网页PageRank作为关键特征,以常见URL、Whois、DNS信息和网页标签信息作为辅助特征,经过随机森林分类模型判断后给出最终的分类结果。实验证明,Nmap-RF集成方法可以在平均9~10 μs的时间内对钓鱼网页进行检测,且可以过滤掉98.4%的不合法页面,平均总精度可达99.6%。  相似文献   

20.
Web分类是在分析了网页的内容后,按照一定的规则将它分到一个或者多个合适的类别中去.支持向量机是在统计学习理论基础上发展起来的一种新的非常有效的机器学习方法.由于其出色的学习性能,该技术已成为分类领域新的研究热点.将支持向量机的理论应用到Web分类中,首先对网页进行了预处理,然后对网页文本进行特征提取和向量表示,最后将二叉树多分类支持向量机应用到Web分类中.通过实验对算法进行了验证,结果表明取得了良好的分类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号