共查询到16条相似文献,搜索用时 78 毫秒
1.
2.
3.
4.
5.
信息安全是人们关注的焦点,从传统的基于行为的安全向基于内容本身的安全不断发展,信息安全的外延在不断扩大。Internet提供的海量、庞杂的信息中,不良信息以不同的表现形式,从不同的角度对不同人群造成毒害或干扰。因此,对网络访问进行必要的、有效的内容过滤是营造健康安全网络环境的重要环节。但是,传统的文本信息过滤算法仅能实现结构对应层次上的判断,无法体现文本的语义,过滤效果难以满足智能化的要求。文中结合计算机语言学知识,提出并实现了一种语义分析的过滤方法,对于那些冗长文本中因为分散存在的关键字而造成的假匹配,通过语义分析,可以很好地甄别处理,从而提高系统的召回率。 相似文献
6.
随着网络的普及,网络上的各种不良文本信息也日益增多,如何对这些不良信息进行监控和过滤成为新的研究课题。文章在相关研究基础上,提出了一种基于语义分析的概念网络构建方式,并介绍了基于此概念网络的文本过滤分析算法。 相似文献
7.
中文文本倾向性分类技术比较研究 总被引:3,自引:1,他引:2
随着近几年互联网的发展,网络评论数量正日益增加。对这些网络评论进行挖掘和分析,识别出其中的情感倾向,可以给用户、企业、政府提供重要的决策支持。采用机器学习方法中的朴素贝叶斯和支持向量机分类模型,根据不同的停用词表、特征选择方法、特征加权方法的组合,对中文文本倾向性分类进行了研究。结论表明,采用保留情感信息相关词性的停用词表,以文档频率为特征选择方法,并应用基于绝对词频的支持向量机分类模型,能取得较好的分类效果。 相似文献
8.
语义分析是计算机理解自然语言的基础,是自然语言理解研究的一个突破点和出发点。从事自然语言理解研究的学者们追求的主要目标是对句子进行正确的语义分析。概念图是支持概念结构思想的一个具体的语义模型,是以图形表示的一种有向连通图。文中分析了中文信息处理中语义研究的必要性和现状,阐述了概念图在语义研究中的应用,并提出了下一步的研究方向。 相似文献
9.
针对目前网络上不良信息变换不同方式逃脱过滤以及中文分词器分词后存在的问题,提出了基于文本分类技术的信息过滤方法,通过在原有的文本自动分类系统中添加三个过滤模块,以过滤掉无用信息、单个独立字、敏感信息等不良内容,从而保障分类安全高效。 相似文献
10.
Web文本内容过滤方法的研究 总被引:7,自引:0,他引:7
文章研究了Web文本内容过滤的方法,分析了向量空间模型、关键词匹配算法等关键技术.并详细讨论了Web网页中文本内容过滤方法的实现过程。重点分析了该方法中的修正值选取、关键词权重函数以及过虑策略等方面的不足,提出了一个改进的Web文本内容过滤方法,能够有效降低算法的复杂性,提高性能。 相似文献
11.
随着信息技术的迅速发展,网络已经逐步成为人们生活当中不可或缺的信息传播工具。由于网络资源的大量使用和信息的大量传输,导致信息过载及安全等问题日益突出。为了解决信息过滤的过滤精度和效率瓶颈等问题,这里详细地对文本信息过滤的主要过程、文本表示方法、特征向量获取、相似度计算等技术进行研究,提出一个基于特征向量的文本信息过滤算法。该过滤算法有效地平衡了计算负载,具有较高的信息过滤性能。 相似文献
12.
5G消息服务的开展为不良图片信息的传播提供了便利条件.不良文字图片作为一种特殊的不良图片信息给通信网络的内容安全带来了挑战.为了能够对不良文字图片进行有效治理,运营商需要借助人工智能技术对图片中的文字信息进行识别和提取.本文详细介绍了不良文字图片治理整个技术过程需要引入的3个处理步骤,并对3个处理步骤涉及到的深度学习模... 相似文献
13.
一种用于网络动画过滤的文字提取方法 总被引:1,自引:1,他引:1
网络动画中往往包含丰富的字符信息,如果能够将这些字符信息加以提取和识别,将对网络动画的有效过滤具有重要意义。论文介绍了一种新的基于类边缘文本提取算法及其实现,该算法利用DCT方法提取出字符的类边缘信息,然后采用基于映射方法进行定位。实验结果表明,该方法能够准确、有效地定位和提取网络动画中的文字区域。 相似文献
14.
通过分析文本挖掘中的2个关键步骤——文本特征空间构造和相似距离度量,指出流行的文本挖掘过程中存在着大量同义和关联噪声。大量存在的同义词和关联词,造成文本特征空间无法准确表达文本语义以及高维计算复杂性问题。利用潜在语义分析和关联规则挖掘构造同义和关联词集,用于减少文本特征空间中的同义词和关联词,降低信息冗余,改进挖掘效率。文中对相应的算法进行了描述,实验结果令人满意。 相似文献
15.