期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于信件源的垃圾邮件过滤 总被引：8，自引：0，他引：8

赵静凯张佳卜宏黄皓《计算机工程与应用》2004,40(9):139-142

众所周知,垃圾邮件问题已经是当今网络世界的一个严重问题。大量无用,甚至有害的信件在网络传播,不仅消耗了大量的网络资源,而且还严重威胁到邮件系统用户信息的安全,对邮件服务器本身提出了严峻的挑战。保护内部邮件服务器,在最大程度上减少垃圾邮件对邮件服务器的破坏是该文将讨论的主题。文章将对这一问题提出一种有效的解决方案,通过基于信件源的邮件过滤来自动地实现对邮件服务器的保护,并且对基于这种方案的反垃圾邮件技术的发展提出一些看法。相似文献

2.

基于贝叶斯方法的垃圾邮件过滤技术综述

张志瑛《数字社区&智能家居》2013,(14):3280-3282,3287

垃圾邮件问题始终困扰着人们,因此一直是当今互联网面临的主要问题之一。许多优秀的文本分类算法被引入垃圾邮件过滤领域,其中包括贝叶斯分类方法。与其他分类方法相比,贝叶斯方法由于其简易实现性,线性计算复杂性、以及准确性成为当今垃圾邮件过滤技术中最流行的方法之一。该文将对基于贝叶斯方法的垃圾邮件过滤技术做出分析和综述,并提出进一步的研究方向。相似文献

3.

垃圾邮件与反垃圾邮件技术

裴亚辉熊盛武《数字社区&智能家居》2007,2(6):1251-1252

最近两年，垃圾邮件肆虐横行，危害越来越大，严重影响了正常的网络运行。本文简单地介绍了垃圾邮件的定义及其产生机理；重点论述了当前流行的反垃圾邮件过滤技术，并对当前最新的反垃圾邮件技术进行了介绍；最后对未来反垃圾邮件过滤技术提出了展望。相似文献

4.

基于信息免疫技术的垃圾邮件过滤技术*

袁耀文盛励《计算机应用研究》2006,23(5):126-127

介绍了一种基于信息免疫技术的垃圾邮件过滤系统的基本组成,并着重对特征元素自学子系统进行了比较详细的介绍。相似文献

5.

基于AIS的垃圾邮件双层过滤方法的研究

毛瑞龙吴丹别荣芳高晓智《计算机工程与设计》2009,30(24)

提出了一种新型的双层垃圾邮件过滤方法.该方法基于免疫学习,免疫记忆和免疫识别等机制,具有一定的自适应能力和多样性,充分利用了垃圾邮件与非垃圾邮件的特征,从而降低了非垃圾邮件被错判的风险.实验结果表明,双层过滤方法可有效的降低垃圾邮件的虚报率(非垃圾邮件被错判为垃圾邮件的比例). 相似文献

6.

应用行为模式识别的垃圾邮件过滤技术

王兆华《计算机光盘软件与应用》2012,(3):74+76

近年来,垃圾邮件在互联网的肆虐程度逐渐加强,据分析,垃圾邮件竟占到互联网总流量的五分之一左右,垃圾邮件产生的巨大的存储需求,极大地威胁了信息安全系统的有效性。垃圾邮件具有多种多样的内容形式,根据互联网安全体系的要求,基于垃圾邮件模式识别技术正日益凸显其功效,有望成为一种简洁可行的反垃圾邮件解决方式。相似文献

7.

防止垃圾邮件过滤器误判正常信息的十项要诀

ZDNet 《网络与信息》2011,25(9):62-63

如果正常信息被垃圾邮件过滤器误判的话．就可能发生严重的问题。举例来说．求职失败、心情感到郁闷甚至丢失业务都属于可能出现的情况。现在．在本文给出的要诀帮助下．广大用户可以保证发送的所有正常信息都到达预定位置。相似文献

8.

基于改进K近邻的垃圾邮件过滤技术

田泽颜松远徐敬东《计算机工程与应用》2007,43(25):178-181

提出了一种基于K近邻（KNN）原理的快速文本分类算法。该算法不仅具有原始K近邻算法分类效果好的优点,还通过对训练样本进行压缩,消除相似度之间的比较,提高了分类效率。实验表明,该算法用于邮件过滤系统时,分类效果要优于基于朴素贝叶斯分类器的二项独立模型和多项式模型,而分类的时间复杂度与其相当,完全可以应用于实时邮件过滤。相似文献

9.

基于语义理解的垃圾邮件过滤处理研究 总被引：1，自引：0，他引：1

麦范金叶东海史慧《中文信息学报》2008,22(5):80-83

文章基于统计和基于规则的垃圾邮件过滤技术,将语义理解的研究和垃圾邮件过滤算法的研究结合起来,构建一个通过语义理解对垃圾邮件进行过滤的模型,并提出一种改进的分词算法,提高了分词的效率、准确率和识别未登录词的能力。最后通过实验数据可知,基于语义理解的过滤模型,在一定程度上解决了邮件过滤中遇到的词的“拆解”的问题、分词后所遇到的未登录词的问题,为垃圾邮件过滤提供了有益的探索。相似文献

10.

基于协同过滤的垃圾邮件过滤系统 总被引：1，自引：0，他引：1

许志佴邹恒明《计算机工程》2008,34(23):153-154

针对当前垃圾邮件过滤技术中邮件性质评价难及邮件附件判断难的问题,提出协同过滤模型,设计一个多层次垃圾邮件过滤系统。该系统针对垃圾邮件一般群发给多人的特点,提取用户的操作和阅读速度进行反馈,利用他人的反馈结果进行协同过滤。实验和分析结果表明,协同过滤技术有效地提高了垃圾邮件过滤的召回率。相似文献

11.

垃圾邮件过滤技术的研究

黄武锋《数字社区&智能家居》2006,(29)

对垃圾邮件的定义、主要危害、滥发原因以及对垃圾邮件过滤技术的主要方法进行了研究,分析了过滤技术在反垃圾邮件中的作用。相似文献

12.

国际化文字处理综述 总被引：3，自引：0，他引：3

芮建武吴健孙玉芳《中文信息学报》2006,20(2):89-95

计算机与不同用户的交互通常必须实现通过多种文字信息的输入/输出以实现,因此操作系统对多种文字的支持程度是其功能性的一个衡量标准。各种文字特征的巨大差异导致现代操作系统的文字处理实现非常复杂。本文总结了操作系统文字处理的范围与内容,包括文本输入与存储,文本处理以及用户交互处理;归纳了通用的文字处理模型和可能采取的技术途径及其优缺点;分析了常用操作系统的文字处理实现;最后展望了文字处理仍面临的挑战。相似文献

13.

企业内部邮件中话题讨论检索研究

富羽鹏张敏马少平《中文信息学报》2008,22(2):81-86

随着信息技术的发展,企业检索已成为人们越来越关注的一个新的应用领域。作为企业检索的一个典型任务,企业内部的邮件检索是在企业中常常遇到的一个问题。企业内部存在着大量的可以公开访问的电子邮件,这些是企业重要的信息资源,如何高速有效地从这些邮件中检索到需要的信息具有很大意义。本文根据电子邮件本身具有的格式化特征和语义拓扑结构提出了基于电子邮件特征的检索模型。实验表明,该模型对电子邮件可以进行有效的检索,并且使用该模型在TREC2006电子邮件话题检索评测中取得了优异的性能成绩。相似文献

14.

汉语意见型主观性文本标注语料库的构建

宋鸿彦刘军姚天昉刘全升黄高辉《中文信息学报》2009,23(2)

汉语意见型主观性文本是目前自然语言处理中的一个研究热点.该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的设计等.汉语意见型主观性文本标注语料库与普通的语料库相比,其特点在于深度标注了主观性文本的词性、句法、语义和意见元素等信息,忠实记录了主观性文本的语言现象.汉语意见型主观性文本标注语料库的构建为人们分析和研究汉语主观性文本提供了有力的资源支持. 相似文献

15.

邻近类别分类在电子邮件过滤系统中的运用

顾辉　李翔薛质李建华《微机发展》2008,18(4):202-205

电子邮件作为互联网技术发展的产物,在给全球网民带来通讯便利的同时,正不可避免地遭遇有悖初衷的运用。最为突出的是随之产生的垃圾邮件像瘟疫一样蔓延,污染网络环境,占用大量传输、存储和运算资源,影响了网络的正常运行。垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。由于常用的特征字串匹配技术对垃圾邮件件的查准率已经不能满足日益提高的过滤系统用户的产品需求,随后引入邻近类别分类的方法,利用基于贝叶斯算法的电子邮件过滤系统,对色情垃圾邮件样本进行分析,可明显提高对垃圾邮件的查准率。相似文献

16.

基于双层级联文本分类的简历信息抽取 总被引：2，自引：1，他引：1

于琨管刚周明王煦法蔡庆生《中文信息学报》2006,20(1):61-68

本文提出了一种基于双层级联文本分类的方法,用于简历信息的自动抽取。本方法将简历文本分解为文本块和文本串,并将简历中包含的信息分解为概要信息与详细信息。首先对简历文本中的文本块进行切分与分类,抽取出概要信息,然后选择可能包含详细信息的文本块,将其切分为文本串,再通过对文本串的分类抽取出详细信息。对1200份中文简历的实验结果表明,本方法适用于简历信息的自动抽取和管理。相似文献

17.

基于信息增益的中文文本关联分类 总被引：1，自引：0，他引：1

陈志雄陈健闵华清《中文信息学报》2007,21(3):61-68

关联分类是一种通过挖掘训练集中的关联规则,并利用这些规则预测新数据类属性的分类技术。最近的研究表明,关联分类取得了比传统的分类方法如C4.5更高的准确率。现有的基于支持度-置信度架构的关联分类方法仅仅是选择频繁文字构建分类规则,忽略了文字的分类有效性。本文提出一种新的ACIG算法,结合信息增益与FoilGain在中文文本中选择规则的文字,以提高文字的分类有效性。实验结果表明,ACIG算法比其他关联分类算法(CPAR)有更高的准确率。相似文献

18.

基于规则的自动分类在文本分类中的应用 总被引：11，自引：3，他引：8

李渝勤孙丽华《中文信息学报》2004,18(4):10-15

文本自动分类是指将文本按一定的策略归于一个或多个类别中的应用技术。本文首先介绍三种基于统计的自动分类技术(k近邻分类器、支持向量机分类器和朴素贝叶斯分类器),剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出。针对此局限性,为了提高自动分类的精度,我们引入了基于规则的自动分类来对其进行改进和扩充,并整合两种自动分类技术的优点,设计出了混合分类器系统,从而获得了比较理想的分类效果。相似文献

19.

基于监督学习的中文情感分类技术比较研究 总被引：6，自引：0，他引：6

唐慧丰谭松波程学旗《中文信息学报》2007,21(6):88-94

情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,以中心向量法、KNN、Winnow、Nave Bayes和SVM作为不同的文本分类方法,在不同的特征数量和不同规模的训练集情况下,分别进行了中文情感分类实验,并对实验结果进行了比较,对比结果表明: 采用BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的情况下,情感分类能取得较好的效果。相似文献