首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
不同用户对邮件的合法性有着不同的认识,因此对邮件过滤的研究应视为不确定信息处理问题,该文提出了一种融合有序加权平均(OWA)算子与模糊支持向量机(FSVM)的邮件过滤方法。其主要思想是利用OWA算子来产生每封邮件的一个合理的综合评价值作为其隶属度,采用FSVM对邮件进行分类。仿真实验结果验证了该方法的有效性。  相似文献   

2.
研究了邮件过滤的主要方法,提出了将Agent技术、粗糙集和最小风险的Bayes分类方法结合的邮件过滤及个性化分类模型.该模型首先利用粗糙集方法对邮件样本向量空间进行约简,然后利用已知样本对最小风险的Bayes分类器进行训练,得到具有智能分类功能的邮件分类器,利用该分类器过滤掉用户不感兴趣的邮件,并利用Agent学习用户的个性化知识,最后利用学习的知识将用户感兴趣邮件进行再分类.  相似文献   

3.
王丽侠 《微机发展》2005,15(9):42-44,47
研究了邮件过滤的主要方法,提出了将Agent技术、粗糙集和最小风险的Bayes分类方法结合的邮件过滤及个性化分类模型。该模型首先利用粗糙集方法对邮件样本向量空间进行约简,然后利用已知样本对最小风险的Bayes分类器进行训练,得到具有智能分类功能的邮件分类器,利用该分类器过滤掉用户不感兴趣的邮件,并利用Agent学习用户的个性化知识,最后利用学习的知识将用户感兴趣邮件进行再分类。  相似文献   

4.
基于双隶属度模糊支持向量机的邮件过滤   总被引:2,自引:0,他引:2       下载免费PDF全文
针对邮件所含信息的模糊性和合法邮件与垃圾邮件错分代价的不对称性提出了基于双隶属度模糊支持向量机的邮件过滤方法,通过对每个样本赋予不同的双隶属度,得到最优分类器,提高了邮件过滤的正确率。经仿真实验证明,该方法能够有效降低将合法邮件误判为垃圾邮件,而且有很高的正确率等特点。  相似文献   

5.
基于支持向量机的邮件过滤   总被引:1,自引:0,他引:1  
随着万维网的兴起和电子邮件的快速发展,大量的垃圾电子邮件也随之在互联网上泛滥.电子邮件过滤就是要在大量邮件中过滤出垃圾邮件,帮助用户找到所需的邮件。本文讨论了基于机器学习方法实现垃圾邮件过滤的原理,提出一种改进的基于支持向量机的邮件过滤技术,该方法使用互信息度函数,结合Z-测试进行特征选择,使用SVM(支持向量机)构造分类超平面来进行文本分类。实验表明,提高了中文邮件过滤的准确性。  相似文献   

6.
黄国伟  许昱玮 《计算机应用》2013,33(7):1861-1865
针对目前垃圾邮件过滤技术仅依赖单一邮件特征实施邮件分类、对邮件特征变化的适应性较差等局限,提出一种基于用户反馈的混合型垃圾邮件过滤方法。以用户社会网络关系为基础,借助用户反馈机制分别实现对基于内容与基于身份标识的邮件分类知识的动态更新;在此基础上采用贝叶斯模型,实现邮件的内容特征与发件人身份标识特征在邮件分类中的有机结合。实验结果表明,与传统的过滤方法比较,所提方法在邮件特征动态变化的环境下能够获得更好的邮件分类效果,邮件分类的总体召回率、查准率、精确率均能达到90%以上。所提方法能够在保证邮件分类性能的同时,有效提高邮件分类对邮件特征变化的适应性,是已有垃圾邮件过滤技术的重要补充。  相似文献   

7.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的邮件分类算法。通过分析朴素贝叶(NB)斯分类算法的原理,改造朴素贝叶斯算法,使其具有动态调整能力。邮件服务器接收到新邮件后自动进行分类判别,用户浏览邮件的过程中对邮件进行操作,根据用户对错分邮件的处理自动将该邮件加入训练数据集,并动态更新相应特征的统计概率,使邮件分类算法能够依据用户对不同邮件的操作行为动态调整分类模型,以达到有效过滤垃圾邮件的目的。与常用的贝叶斯分类算法的实验比较表明在给定小样本集合进行训练的情况下,新算法对于垃圾邮件的识别率比传统的朴素贝叶斯方法、基于风险敏感的朴素贝叶斯方法等提高了10%,获得了较好的分类性能。  相似文献   

8.
提出了一种新的基于遗传模糊软分类和卡尔曼滤波方法的模糊辨识算法.该算法由3个步骤组成:(1)基于遗传算法确定模糊C均值(FCM)中的最佳分类数,从而确定模糊规则的前件和样本在各类中的隶属度;(2)采用最小二乘法(LS)来确定模糊规则后件的初始参数;(3)用卡尔曼滤波方法调整后件参数.最后,运用该算法对我国全要素生产力进行了模糊规则的提取.  相似文献   

9.
基于密度法的双隶属度模糊支持向量机   总被引:1,自引:0,他引:1  
针对现实环境中样本集越来越大,并且往往含有大量噪声和野值,导致传统模糊支持向量机的训练时间和分类识别率降低的阃题,提出基于密度法的双隶属度模糊支持向量机,即靠近类中心的样本点隶属度由其到类中心的距离确定,远离类中心的样本点隶属度由其邻域内同类异类样本点数量的比例确定。从理论和实证两个方面分析文中方法与以往基于密度的模糊支持向量机(DFSVM)相比,该方法不但降低了算法的复杂度,并且提高了支持向量机的分类精度。  相似文献   

10.
提出一种基于多属性群决策的垃圾邮件过滤方法来解决垃圾邮件过滤器出现误判的情况,其基本思想是通过OWA(有序加权平均,ordered weighted averaging)算子和CWAA(组合加权平均,combination weighted arithmetic averaging)算子相结合的多属性群决策方法对每封邮件计算出一个合理的综合评价值作为隶属度,然后采用FSVM分类算法对邮件进行分类.实验表明该算法在一定程度上提高了垃圾邮件过滤的召回率和准确率.  相似文献   

11.
Content-based e-mail spam filtering continues to be a challenging machine learning problem. Usually, the joint distribution of e-mails and labels changes from user to user and from time to time, and the training data are poor representatives of the true distribution. E-mail service providers have two options for automatic spam filtering at the service-side: a single global filter for all users or a personalized filter for each user. The practical usefulness of these options, however, depends upon the robustness and scalability of the filter. In this paper, we address these challenges by presenting a robust personalizable spam filter based on local and global discrimination modeling. Our filter exploits highly discriminating content terms, identified by their relative risk, to transform the input space into a two-dimensional feature space. This transformation is obtained by linearly pooling the discrimination information provided by each term for spam or non-spam classification. Following this local model, a linear discriminant is learned in the feature space for classification. We also present a strategy for personalizing the local and global models using unlabeled e-mails, without requiring user’s feedback. Experimental evaluations and comparisons are presented for global and personalized spam filtering, for varying distribution shift, for handling the problem of gray e-mails, on unseen e-mails, and with varying filter size. The results demonstrate the robustness and effectiveness of our filter and its suitability for global and personalized spam filtering at the service-side.  相似文献   

12.
Earlier works on detecting spam e-mails usually compare the contents of e-mails against specific keywords, which are not robust as the spammers frequently change the terms used in e-mails. We have presented in this paper a novel featuring method for spam filtering. Instead of classifying e-mails according to keywords, this study analyzes the spamming behaviors and extracts the representative ones as features for describing the characteristics of e-mails. An back-propagation neural network is designed and implemented, which builds classification model by considering the behavior-based features revealed from e-mails’ headers and syslogs. Since spamming behaviors are infrequently changed, compared with the change frequency of keywords used in spams, behavior-based features are more robust with respect to the change of time; so that the behavior-based filtering mechanism outperform keyword-based filtering. The experimental results indicate that our methods are more useful in distinguishing spam e-mails than that of keyword-based comparison.  相似文献   

13.
研究一类具有时变、有界干扰的非线性随机不确定系统有限时间H∞滤波问题.首先,给出了非线性随机不确定系统有限时间H∞滤波问题的定义;其次,通过构造Lyapunov-Krasoviskii函数,并结合线性矩阵不等式(LMI)方法,给出了非线性随机不确定系统有限时间∞滤波器存在的充分条件;再次,将该问题简化为具有LMI约束的优化问题,并给出了相应的求解算法;最后,通过数值算例表明了所提出设计方法的有效性.  相似文献   

14.
将约束引入到可能性XML时,因分布节点值的不确定性,XML文档无法检验对涉及分布节点的约束的合法性。在一些场景中,要返回给用户符合约束的查询结果和概率,通常没有考虑去除不可能域分布来做条件计算,得出的并不是准确概率。为此,提出一种可能性XML的概念,给出可能性XML中可能域和约束的有效表达,通过提出的方案解决条件计算和准确概率计算的问题。实验结果表明,该算法的效率较高,条件计算后的结果更能被用户接受。  相似文献   

15.
兴趣点(Point-Of-Interest,POI)推荐是基于位置社交网络(Location-Based Social Network,LBSN)中一项重要的个性化服务,可以帮助用户发现其感兴趣的[POI],提高信息服务质量。针对[POI]推荐中存在的数据稀疏性问题,提出一种融合社交关系和局部地理因素的[POI]推荐算法。根据社交关系中用户间的共同签到和距离关系度量用户相似性,并基于用户的协同过滤方法构建社交影响模型。为每个用户划分一个局部活动区域,通过对区域内[POIs]间的签到相关性分析,建立局部地理因素影响模型。基于加权矩阵分解挖掘用户自身偏好,并融合社交关系和局部地理因素进行[POI]推荐。实验表明,所提出的[POI]推荐算法相比其他方法具有更高的准确率和召回率,能够有效缓解数据稀疏性问题,提高推荐质量。  相似文献   

16.
推荐系统是电子商务系统中最重要的技术之一,用户相似性度量方法是影响推荐算法准确率高低的关键因素。针对用户评分数据极端稀疏情况下传统相似性度量方法的不足,提出了一种基于群体兴趣偏好度的协同过滤推荐算法,根据群体兴趣偏好度来预测用户对未评分项目的评分,在此基础上再采用传统的相似性度量方法计算目标用户的最近邻居。实验结果表明,该算法可以有效解决用户评分数据极端稀疏情况下传统相似性度量方法存在的问题,显著提高推荐系统的推荐质量。  相似文献   

17.
基于相似度传递的协同过滤算法   总被引:2,自引:1,他引:1       下载免费PDF全文
协同过滤算法是个性化推荐系统中应用较广的算法之一。随着用户数量及项目数量的增加,数据的稀疏问题成为影响个性化推荐质量的重要因素。为此,提出一种基于相似度传递的协同过滤算法。该算法能使大于阈值的用户相似度在有限路径长度上传递,增加可用于计算推荐值的用户最近邻居的数量,减少数据稀疏问题的影响,提高推荐质量。  相似文献   

18.
相似度计算在个性化推荐系统中是基本运算,但无论是基于内容还是基于协同过滤的推荐,目前常用的向量相似度计算还存在可以改进之处。在海量公开的数据集上的实验表明,在基于内容的推荐中引入机器学习方法以及在协同过滤推荐中引入区分度来改善相似度计算,可以获取更高的准确率。对MapReduce的分布式计算流程的改进,使得相似度计算更为高效。  相似文献   

19.
网络游戏在全球范围内迅速发展,其用户不断增加,因此游戏数据流的识别有着重要的现实意义。利用Wireshark,抓取不同类型的网络游戏流数据,包括大型多人在线角色扮演类、第一人称射击类、实时策略类游戏和卡牌类等游戏,对游戏流识别进行研究。采用协议过滤和IP过滤的方法对数据进行预处理,分别对下行和上行数据进行大量的统计特征分析,发现包大小信息熵、下上行包数目之比和PPS(Packets Per Second)等特征适用于游戏流分类。分类实验结果表明,利用IP过滤和提取出的特征组合可以有效地提高识别准确率。  相似文献   

20.
将最大熵模型引入到邮件过滤中,结合邮件的半结构化特性,给出改进的特征函数定义,形成邮件特征向量。在此基础上,构造出基于最大熵模型的邮件过滤系统的基本框架。实验结果表明,这种过滤方法在召回率、准确率等方面表现出了良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号