共查询到20条相似文献,搜索用时 31 毫秒
1.
网页内容过滤技术中的特征提取 总被引:2,自引:0,他引:2
有害的网络内容日益猖獗,为封锁色情网页,论文通过统计和分析,主要从四个方面提取色情网页的特征:网页的布局,因特网内容选择平台(PICS)等级评定应用,暗示性条文和文档内容。从这四个方面的特征能几乎完全区分色情网页和非色情网页,该基本框架也适用于过滤网上除色情以外的其它不益内容。 相似文献
2.
基于内容的网页特征提取 总被引:6,自引:1,他引:5
文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。 相似文献
3.
4.
基于Web内容和日志挖掘的个性化网页推荐系统 总被引:1,自引:0,他引:1
目前的网页推荐服务大都是基于对查询关键词的匹配来实现的,缺乏自动提取用户兴趣并进行推荐的能力。本文设计和实现了一个基于Web内容和日志挖掘的个性化网页推荐系统Webpage-recom- mender,该系统采用特征提取技术,能自动识别用户的兴趣,并主动推荐和筛选与用户兴趣主题相关的网页。实验结果证明了该系统的有效性。 相似文献
5.
6.
朱逢春 《电子制作.电脑维护与应用》2015,(8)
在网页文本信息自动采集的实际应用中,网页检索采集到的资源存在着大量与网页主题内容无关的"噪音"信息,本文主要内容是研究基于DOM树的网页去噪技术,通过对网页结构的转化,将网页转化成DOM树,在此基础上过滤掉网页噪音信息,提取网页文本的正文内容。 相似文献
7.
8.
YUAN Zi-hai 《数字社区&智能家居》2008,(8)
无论是门户网站还是如今流行的B/S结构的企业MIS,都是靠网页来展现它的内容、与用户进行交流。网页可以简单地描述为"内容 表现",CSS(Cascading Style Sheet,级联样式表)是最好的网页"表现"技术,它使用一套完整而且灵活的规则,将网页的内容和表现方法彻底分离,利用它能设计出具有复杂布局的精美网页,并且代码简洁、干净、易于调整和维护,为网页设计人员和维护人员节省大量的时间和精力,提高企业的经济效益。 相似文献
9.
10.
Media Detective是一款非常犀利的媒体文件查找工具,软件内置了识别图片和影片的Skin-tone技术,可以自动扫描指定范围内的多媒体文件,包括图片,视频,音频,文档,网页历史。如果发现色情内容或无用的垃圾文件,你可以立即将其清除出去。当然,你还可以顺带着使用这款软件浏览图片或是观看影看,功能绝对是物超所值。 相似文献
11.
12.
13.
14.
网络淫秽色情犯罪的法律控制 总被引:1,自引:0,他引:1
网上传播淫秽物品的行为一般表现为上载,下载淫秽色情物品和建立展示淫秽物品的超链接点。上载淫秽物品是指行为人通过网络将淫秽色情物品载入互联网的行为。例如行为人建立网站或者自己的个人主页。然后,通过将淫秽色情物品上载至网页中供他人浏览或者观看。下载淫秽色情物品有两种形式,一种是指行为人将淫秽色情物品从互联网发送到不特定人的电子邮件中,当用户打开自己的电子邮件时就能浏览到这些淫秽色情物品的行为。 相似文献
15.
李小麟 《电脑编程技巧与维护》2011,(9):90-91
动态网贞技术是基于内容数据库和内容管理软件的网页生成技术,由于它可以提高时效性,减少差错,绝大多数网站都采用这一技术实现内容更新。采用动态网页技术时,内容管理软件读取内容数据库,经过计算后,对预先编制的网页框架进行填充,生成所需的网页,响应浏览请求。当网页的结构比较复杂时,由于数据库查询和计算的复杂程度增加, 相似文献
16.
随着Web技术的迅速发展,动态和个性化网页的比重日益增加,而传统缓存一般只适用于静态内容,难以减少获取动态网页所需的流量和延时代价。为了更有效地分发动态网页,人们提出了各种动态内容加速方案。文中研究了典型的动态网页分发加速方法,并对相关的加速技术进行了分析和比较。针对ESI和CDE这两种技术的优缺点,提出基于共享片段的动态网页分发加速模型。实验结果表明,与ESI和CDE相比,该模型可以节省更多的带宽,减少更多的延时。 相似文献
17.
随着Web技术的迅速发展,动态和个性化网页的比重日益增加,而传统缓存一般只适用于静态内容,难以减少获取动态网页所需的流量和延时代价.为了更有效地分发动态网页,人们提出了各种动态内容加速方案.文中研究了典型的动态网页分发加速方法,并对相关的加速技术进行了分析和比较.针对ESI和CDE这两种技术的优缺点,提出基于共享片段的动态网页分发加速模型.实验结果表明,与ESI和CDE相比,该模型可以节省更多的带宽,减少更多的延时. 相似文献
18.
互联网上淫秽色情内容呈现的泛滥之势,正在引起广大人民群众的强烈不满。据调查.全世界约有色情网站420万家,含色情网页3.72亿页,占总网页数的12%。而目前网民中18至24岁的年轻人约占34%,18岁以下的占19%左右,25至30岁的约占17%,网民结构正呈现低龄化趋势。黄色网站不仅毒害了广大青少年.就是对成年人也是一个危 相似文献
19.
针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于规则匹配和随机森林方法的集成钓鱼网站检测方法。根据网页协议对网站进行预过滤,若判定其为钓鱼网站则省略后续特征提取步骤。否则以文本关键字置信度,网页子链接置信度,钓鱼类词汇相似度以及网页PageRank作为关键特征,以常见URL、Whois、DNS信息和网页标签信息作为辅助特征,经过随机森林分类模型判断后给出最终的分类结果。实验证明,Nmap-RF集成方法可以在平均9~10 μs的时间内对钓鱼网页进行检测,且可以过滤掉98.4%的不合法页面,平均总精度可达99.6%。 相似文献