首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 875 毫秒
1.
基于神经网络的电子邮件分类与过滤   总被引:2,自引:0,他引:2  
任劼  项婧 《计算机工程与设计》2006,27(6):1021-1024,1064
现在电子邮件的应用非常广泛,已经成为人们生活中一种重要的通讯手段,但各种各样的垃圾邮件也是令我们十分困扰的问题,给出了一种电子邮件的分类过滤方法。电子邮件作为一种半结构化的文档,电子邮件信息包含了固定的语法部分和一定长度的可变文本部分,同时处理这两部分以得到更高的准确度。首先对邮件进行文本处理,得到特征向量;然后使用基于神经网络的方法对邮件进行分类过滤得到邮件分类器;最后通过实验验证分类器的有效性。  相似文献   

2.
鲁成岩 《电脑》1999,(5):47
Outlook EXpress是一个功能非常强大的电子邮件管理软件,不仅可以管理多个邮件帐号,还可以自动为邮件添加签名,即:自动在一个邮件中加入一段文本(其内容可以是发件人的姓名、通信地址、联系电话、E—Mail等)或者是附加一个名片文件(vCard,同样包含了该发件人的联系信息)。下面就让我们来看一看如何实现上述自动签名功能。  相似文献   

3.
电子邮件是互联网的重要应用之一,邮件分类问题已成为当今研究的热点。本文基于粗糙集理论,利用0-1贝努利数据提出双向邮件分类模型,在保证当前分类正确率的前提 下,约简了邮件分类所需的文本词频信息,较好地提高了分类效率,推进了粗糙集理论在邮件分类中的应用。  相似文献   

4.
组合:要给重要的项目、人物和主题建立文件夹,然后,手工操作把电子邮件转送到相应的文件夹里。大多数Windows 95和Macintosh软件制作商允许用户在文件夹之间转送电子邮件。规则:如果用户收到许多电子邮件,也许想利用这些电子邮件程序提供的“收件箱助理”功能。这些程序允许用户建立筛选方案,它会依据邮件标题中发送邮件人的姓名或其它的参数自动将邮件分类并转送到相应的文件夹中。挑选:绝大多数成熟的电子邮件程序允许用户通过察看主题区或发送邮件人的姓名来挑选新邮件。用户可以将这些信息按规定方案转送到相应的文件夹中,或简单地把它们直接送到废物箱中(Mac用户)或回收箱中。自动回复:有时自动回复也可称“自动回复器”,该功能可以自动回复电  相似文献   

5.
基于文本挖掘的邮件分类与过滤   总被引:6,自引:0,他引:6  
该文提出一种基于文本挖掘的邮件分类与过滤的方法,它包括邮件采集与预处理、文本分词、特征选取、邮件分类器和过滤器等功能模块。该系统不仅可使邮件服务器具有自动过滤垃圾邮件的能力,也可以用于电子政务和电子商务,对邮件自动分类和转发。  相似文献   

6.
基于支持向量机的邮件过滤   总被引:1,自引:0,他引:1  
随着万维网的兴起和电子邮件的快速发展,大量的垃圾电子邮件也随之在互联网上泛滥.电子邮件过滤就是要在大量邮件中过滤出垃圾邮件,帮助用户找到所需的邮件。本文讨论了基于机器学习方法实现垃圾邮件过滤的原理,提出一种改进的基于支持向量机的邮件过滤技术,该方法使用互信息度函数,结合Z-测试进行特征选择,使用SVM(支持向量机)构造分类超平面来进行文本分类。实验表明,提高了中文邮件过滤的准确性。  相似文献   

7.
宋迪 《微计算机信息》2008,24(3):201-202
为了有效的处理企业大量的客户邮件,本文提出了一种电子邮件自动回复的方法.首先对客户邮件进行分类,然后使用相应的回复模板进行邮件自动回复.根据客户邮件的具体特点,本文采用基于概念提取的分类技术并设计两种不同分类标准(产品标准和需求标准),这些改进措施大大提高了邮件的回复效率.  相似文献   

8.
基于数据挖掘的邮件分类识别研究   总被引:1,自引:0,他引:1  
在贝叶斯过滤技术的启发下,选择数据挖掘的方法来研究一种具有学习能力的邮件过滤技术.通过对电子邮件的分析和研究,提出对邮件结构字段信息和邮件正文信息加以离散和特征化处理,用向量的方式表示电子邮件,建立了一种基于信息熵的决策树邮件分类识别模型.  相似文献   

9.
周冠玮  程娟  平西建 《计算机工程》2007,33(15):199-201
如何利用邮件的正文与附件信息有效地实现其分类,是现在邮件处理领域一个重要的课题。该文从商业应用角度提出了一种基于图像信息度量与关键词的邮件智能过滤与分发方法,通过基于朴素贝叶斯分类器的邮件关键词信息处理,及附件图像信息的基于归一化PIM文本图像检测理论的分析,能够综合运用邮件正文、地址等文本信息与附件图像信息作为分类的评价参数,有效地实现了邮件的智能分类。  相似文献   

10.
中文邮件分类器的设计与实现   总被引:2,自引:0,他引:2  
徐海涛  杨森  柴乔林 《计算机应用》2003,23(Z2):166-169
随着电子邮件给人们生活带来方便的同时,也产生了许多新的问题,其中之一就是用户如何能从大量邮件中找到自己所需要的信息.传统上邮件的过滤是由使用者以人工的方式来进行,一些电子邮件软件提供使用者自定过滤规则来帮助分类.文中的目的是设计一个能够适用在中文邮件上的分类系统.邮件中不同的特征应各自使用较为适合的分类器,并结合分类器来预测邮件类别.实验结果显示该系统在邮件分类上有较好的正确率.  相似文献   

11.
基于内容粘合性的邮件分类   总被引:1,自引:0,他引:1  
廖玲  文敦伟 《计算机仿真》2008,25(2):121-123
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容.针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量方法提取n-gram的思想运用于文本表示当中,对词的权重进行赋值,并以此模型设计了一个邮件分类系统,由于粘合性方法考虑到了邮件的结构特征,实例证明,这种方法能够提高系统的分类精确度.  相似文献   

12.
为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在Map Reduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用Map Reduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。  相似文献   

13.
基于词频的特征表示方法难以准确表示Email的主要内容,从而导致分类的综合性能(F—score)较差,为了解决这个问题,将领域知识引入了Email的特征表示,并在此基础上提出了一种综合领域知识和词频的特征表示方法,用于Email分类.本方法在词频特征的基础上加入人工总结出的领域特征,从而更加准确地表示Email的主要内容,以提高Email分类的平均F—score.基于1080篇Email的分类测试结果表明,与基于词频的特征表示方法和基于领域知识的特征表示方法相比,本方法在针对Email标题实现的Email分类中将平均F—score分别提高了12.28%和23.08%,从而达到69.33%的分类平均F—score.  相似文献   

14.
基于Rough Set的电子邮件分类系统   总被引:6,自引:0,他引:6  
随着电子邮件的广泛使用,通过它进行不良信息传播的事件不断发生,电子邮件分类问题成为了网络安全研究的热点。本文通过对电子邮件头进行分析,运用Rough Set理论中相关的数据分析技术,建立了电子邮件分类系统的模型,并进行了实验测试,得到了满意的结果。  相似文献   

15.
Without imposing restrictions, many enterprises find nonwork-related contents consuming network resources. Business communication over emails thus incurs undesired delays and inflicts damages to businesses, explaining why many enterprises are concerned with the competition to use email services. Obviously, enterprises should prioritize business emails over personal ones in their email service. Therefore, previous works present content-based classification methods to categorize enterprise emails into business or personal correspondence. Accuracy of these methods is largely determined by their ability to survey as much information as possible. However, in addition to decreasing the performance of these methods, monitoring the details of email contents may violate privacy rights that are under legal protection, requiring a careful balance of accurately classifying enterprise emails and protecting privacy rights. The proposed email classification method is thus based on social features rather than a survey of emails contents. Social-based metrics are also designed to characterize emails as social features; the obtained features are treated as an input of machine learning-based classifiers for email classification. Experimental results demonstrate the high accuracy of the proposed method in classifying emails. In contrast with other content-based methods that examine email contents, the emphasis on social features in the proposed method is a promising alternative for solving similar email classification problems.  相似文献   

16.
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确。文中提出了改进的向量空间模型,针对邮件特有的结构,以段落为分块单位,通过分析段落间的关系和段落中的内容来更改特征词的权重。以此模型设计了一个邮件分类系统,并对该系统进行了测试和结果分析。  相似文献   

17.
Bo Yu  Dong-hua Zhu 《Knowledge》2009,22(5):376-381
Email is one of the most ubiquitous and pervasive applications used on a daily basis by millions of people worldwide, individuals and organizations more and more rely on the emails to communicate and share information and knowledge. However, the increase in email users has resulted in a dramatic increase in spam emails during the past few years. It is becoming a big challenge to process and manage the emails efficiently for and individuals and organizations. This paper proposes new email classification models using a linear neural network trained by perceptron learning algorithm and a nonlinear neural network trained by back-propagation learning algorithm. An efficient semantic feature space (SFS) method is introduced in these classification models. The traditional back-propagation neural network (BPNN) has slow learning speed and is prone to trap into a local minimum, so the modified back-propagation neural network (MBPNN) is presented to overcome these limitations. The vector space model based email classification system suffers from a large number of features and ambiguity in the meaning of terms, which will lead to sparse and noisy feature space. So we use the SFS to convert the original sparse and noisy feature space to a semantically richer feature space, which will helps to accelerate the learning speed. The experiments are conducted based on different training set size and extracted feature size. Experimental results show that the models using MBPNN outperform the traditional BPNN, and the use of SFS can greatly reduce the feature dimensionality and improve email classification performance.  相似文献   

18.
Kristof  Dirk   《Decision Support Systems》2008,44(4):870-882
Customer complaint management is becoming a critical key success factor in today's business environment. This study introduces a methodology to improve complaint-handling strategies through an automatic email-classification system that distinguishes complaints from non-complaints. As such, complaint handling becomes less time-consuming and more successful. The classification system combines traditional text information with new information about the linguistic style of an email. The empirical results show that adding linguistic style information into a classification model with conventional text-classification variables results in a significant increase in predictive performance. In addition, this study reveals linguistic style differences between complaint emails and others.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号