首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
随着因特网普及和信息技术广泛应用,网络上大量的色情、暴力、反动等不良信息的入侵。对于不良信息的检测和传播控制显得越来越重要,关系到国家安全和社会稳定。单机模式的不良信息的甄别与检测已不能满足社会的需求,Hadoop云平台作为能够对大量数据进行分布式处理的软件框架,提供了MapReduce,、分布式文件系统HDFS有助于文本安全检测的并行化处理。为此文中提出一种基于Hadoop云平台,可以通过句式结构的判别上下文逻辑的关联性对不良信息的并行检测的模型,减少了检测时间,提高了检测效率。  相似文献   

2.
鉴于电子布告栏系统(BBS)内容安全监管的重要性,基于人机结合的思想,提出了BBS内容安全监管系统框架,并对其实现的关键技术进行了分析,给出了几种适用于不良信息文本实时识别的方法,对各算法用于不良信息识别的原理和方法进行了描述.  相似文献   

3.
网页被植入暗链是企事业网站上常见的攻击行为,攻击手法变化多样,传统方法基于规则检测已经无法高效检出。本文使用域识别机制提取风险文本和安全文本,通过LDA模型和Doc2vec模型计算主题异样度、风险文本异常概率、风险文本向量等特征,分别选用SVM模型、逻辑回归模型、随机森林模型构建监督学习模型检测网页暗链并对比模型效果。实验结果表明,该方法具有较好的检出效果和运行效率,其中随机森林模型检出准确率达到了0.999。  相似文献   

4.
为进一步加强互联网管理,依法打击国内违法网站,中国互联网协会新闻信息服务工作委员会启用了“违法和不良信息举报中心信息处理系统”。有效处理公众对为淫秽色情等违法网站提供链接和广告服务的境内网站进行的举报。重庆市互联网协会根据相关工作精神,及时制定了《违法和不良信息举报处理流程(暂行)》。  相似文献   

5.
WAP不良信息监测系统指通过旁路采集方式监控经过WAP网关的网页内容,分析网页内的网址、文本、图片、音视频等内容,及时发现包含不良信息的网页并对其进行拦截。系统的选型测试在整个WAP不良信息监控系统的构建中起着至关重要的作用  相似文献   

6.
本文主要研究网络不良信息识别方法,提出了一种基于免疫原理的不良信息识别方法,其中应用了多层防护、抗原识别、阴性选择、克隆选择、协同刺激及免疫应答等免疫原理,并对检测规则生成方法进行了改进。通过实验验证了该方法在识别率、误判率与漏判率方面都优于传统的不良信息识别方法,并具有良好的适用性和扩展性。  相似文献   

7.
应国家对视频网站加强有序管理的迫切要求,文中应用一种基于多模态特征的网络视频分类方法,实现对网络视频的安全监管。该方法对从网络视频中提取三大类的视频特征,分别针对音频特征、运动和颜色以及空间和时间特征,递进地对视频进行过滤。通过对视频中不良场景的定义,包括恐怖、暴力和色情语义,以检测网络视频内容中潜在的不良信息,实验证明该方法有效地提高了不良视频检测和分类的准确率。  相似文献   

8.
网络不良信息呈多元化发展   总被引:1,自引:0,他引:1  
2月17日,网康科技在京发布了《中国互联网“不良信息”研究报告(2008)》。报告显示,据网康互联网内容研究实验室的统计表明,目前网络不良信息的多元化趋势已经非常明显,主要集中在违反法律、违反道德、破坏信息安全3大类别。根据不良信息的活跃度,赌博、假证件办理、代写论文、黑客网站、色情淫秽等信息已成为不良信息的最主要内容。  相似文献   

9.
随着网络的普及,网络上的各种不良文本信息也日益增多,如何对这些不良信息进行监控和过滤成为新的研究课题。文章在相关研究基础上,提出了一种基于语义分析的概念网络构建方式,并介绍了基于此概念网络的文本过滤分析算法。  相似文献   

10.
涉黄域名二次中标问题研究   总被引:1,自引:1,他引:0  
本文分析不良信息监测系统中出现的部分涉黄网站“二次中标”的情况.基于对用户访问原理、网站封堵的理论原理进行分析,对已中标网站进行大量拨测实验;结合理论分析与测试结果指出网站二次中标的原因是因为流控系统的处理能力不足.通过实验对该结论进行验证并提出解决方案与建议.  相似文献   

11.
微博短文本中存在一些相同或相近、但与主题关系不大的词项,对准确度量文本之间的相似性具有较大的干扰作用,影响微博话题被发现的质量。提出一种基于文本内容与结构化信息相结合的特征词选择算法,能有效提取具有代表性的特征词,并对文本、话题间相似度的计算策略进行改进,然后将特征词选择算法与相似度计算方法融合,应用于微博文本数据实现话题发现。实验结果表明,本算法能有效降低话题发现的平均漏检率与误检率,提高话题发现质量。  相似文献   

12.
5G消息服务的开展为不良图片信息的传播提供了便利条件.不良文字图片作为一种特殊的不良图片信息给通信网络的内容安全带来了挑战.为了能够对不良文字图片进行有效治理,运营商需要借助人工智能技术对图片中的文字信息进行识别和提取.本文详细介绍了不良文字图片治理整个技术过程需要引入的3个处理步骤,并对3个处理步骤涉及到的深度学习模...  相似文献   

13.
周炫余  刘娟  卢笑  邵鹏  罗飞 《电子学报》2017,45(1):140-146
针对纯视觉行人检测方法存在的误检、漏检率高,遮挡目标以及小尺度目标检测精度低等问题,提出一种联合文本和图像信息的行人检测方法.该方法首先利用图像分析的方法初步获取图像目标的候选框,其次通过文本分析的方法获取文本中有关图像目标的实体表达,并提出一种基于马尔科夫随机场的模型用于推断图像候选框与文本实体表达之间的共指关系(Coreference Relation),以此达到联合图像和文本信息以辅助机器视觉提高交通场景下行人检测精度的目的.在增加了图像文本描述的加州理工大学行人检测数据集上进行的测评结果表明,该方法不仅可以在图像信息的基础上联合文本信息提高交通场景中的行人检测精度,也能在文本信息的基础上联合图像信息提高文本中的指代消解(Anaphora Resolution)精度.  相似文献   

14.
互联网的迅猛发展,越来越迫切地需要全面准确对网上信息进行分类及统计,Web挖掘技术的兴起,尤其是该技术中的文本挖掘,使这种统计成为可能。本文研究了互联网信息统计的现状,介绍了Web挖掘技术并分析了Web文本挖掘的关键技术。继而结合文本挖掘技术设计了网站分类系统的模型,同时对其开发步骤进行了说明。最后展望了此技术方案在相关领域的应用前景。  相似文献   

15.
随着互联网技术的飞速发展,如何有效地组织和管理就成了人们首先需要解决的问题。本文提供了一种基于网站内容对互联网站进行分类的方法。研究并探讨了实现网站分类方法的一系列关键技术,包括分类体系的确定,训练集的建立,文本预处理,特征提取和分类器的实现。最后给出了该网站分类方法的分类质量实验结果。  相似文献   

16.
提出了一种基于Android平台的汇集团购信息的业务模型.该模型首先基于Linux的平台建立一个小型的抓取各团购网站信息的服务器,并且设置一个守护线程等待移动客户端的连接,然后基于Android系统开发技术开发浏览团购信息的移动客户端,该客户端可从服务器上获得相关团购信息.测试表明该模型运行稳定,具有较好的市场推广前景.  相似文献   

17.
面向不良文本信息的中文网页分类方法   总被引:1,自引:0,他引:1  
结合Internet不良文本信息的特点,运用贝叶斯理论设计了一种面向该类信息的网页分类方法,该方法兼顾分类效率与分类精度,对特征项选取以及权重计算的方法进行了优化,降低了分类特征维数,简化了分类过程的处理.实验数据表明,该方法保持了良好的性能,提高了效率.  相似文献   

18.
李慧  施荣华 《信息技术》2007,31(12):73-76
网页过滤系统旨在帮助用户屏蔽不健康的网页。提出了基于混合模式的网页过滤模型,将传统的基于网址过滤和敏感词过滤的方法与基于文本分类的过滤方法结合起来。重点讨论了特征量选取、网页结构化信息利用等方面的改进措施。实验表明这种模型在保持易于实现的特点的同时,在速度和准确度方面都有不同程度的提高。  相似文献   

19.
现有的基于分割的场景文本检测方法仍较难区分相邻文本区域,同时网络得到分割图后后处理阶段步骤复杂导致模型检测效率较低.为了解决此问题,该文提出一种新颖的基于全卷积网络的场景文本检测模型.首先,该文构造特征提取器对输入图像提取多尺度特征图.其次,使用双向特征融合模块融合两个平行分支特征的语义信息并促进两个分支共同优化.之后,该文通过并行地预测缩小的文本区域图和完整的文本区域图来有效地区分相邻文本.其中前者可以保证不同的文本实例之间具有区分性,而后者能有效地指导网络优化.最后,为了提升文本检测的速度,该文提出一个快速且有效的后处理算法来生成文本边界框.实验结果表明:在相关数据集上,该文所提出的方法均实现了最好的效果,且比目前最好的方法在F-measure指标上最多提升了1.0%,并且可以实现将近实时的速度,充分证明了该方法的有效性和高效性.  相似文献   

20.
图书馆网站设计的探讨   总被引:8,自引:0,他引:8  
刘玉 《信息技术》2003,27(3):87-88
介绍了当今信息时代建设图书馆网站的重要性和作用 ,以及在网站设计评估中应着重注意的包括网站内容、页面设计及安全性能等三方面的问题 ,同时提出 ,图书馆网站建设中如何在这几方面进行改进和完善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号