首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 76 毫秒
1.
基于改进蚁群算法的聚类分析   总被引:2,自引:0,他引:2  
聚类在数据挖掘、统计学、机器学习等很多领域都有很大应用.聚类问题可以归结为一个优化问题.蚁群算法(Ant Colony Algorithm)已成功地解决了许多组合优化的难题.介绍一种蚁群聚类算法,并进行了优化,提出一种改进的蚁群聚类算法.它改进了蚂蚁搜索解的方法,并引入均匀交叉算子,将蚁群算法和遗传算法融合.它提高进化速度,有效改善了蚁群算法易于过早地收敛于非最优解的缺陷.仿真实验取得了较好的结果.  相似文献   

2.
基于免疫网络聚类算法的特征垃圾邮件获取技术   总被引:1,自引:0,他引:1  
文章给出了一种基于免疫网络聚类算法的邮件服务器端特征垃圾邮件获取技术,其功能是将属同一邮件服务器内的邮件用户各自认可的垃圾邮件进行自动汇总,抽取出共性的垃圾邮件,从而能在邮件服务器端对这些共性垃圾邮件进行拦截,该技术体现出高效的动态性质,可作为目前主流反垃圾技术的辅助技术。  相似文献   

3.
基于签名的近似垃圾邮件检测算法   总被引:1,自引:1,他引:0  
针对垃圾邮件短小、一定时间内在网络上重复、大量地散发的特点,提出了基于签名的近似垃圾邮件检测算法(ASD)。该算法以句为基本单位,求取邮件所含的全部句子的摘要,垃圾邮件的近似检测转变为两个摘要集近似度的比较。通过与近似文本查询算法DSC、DSC-SS、I-Match的比较,ASD算法在近似垃圾邮件查询中,表现出样本集的存储空间大小适中、运算时问短、鲁棒性高、高准确率、高召回率的特征。  相似文献   

4.
以智能决策支持系统结构为基础,提出了一种新的电子邮件过滤模型.并对中文垃圾邮件过滤中的中文分词及垃圾邮件特征知识库的更新等关键问题进行了探讨。开发了“智能邮件过滤系统(JEFS)”,使垃圾邮件误判率得到了一定程度的控制.有效防止了垃圾邮件的泛滥。  相似文献   

5.
提出一种基于差分算法的聚类分析方法,采用结构体数组对聚类的中心进行编码,并用样本向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过变异、交叉和选择操作对聚类中心的编码进行优化,以获得最好的聚类中心.通过差分算法的全局搜索能力,来获取全局最优结果.实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法,也一般优于基于遗传算法的聚类算法和基于微粒群的聚类算法.  相似文献   

6.
绝缘子串作为输电线路中最重要的基础设施之一,对其准确识别是实现运行状态监测与故障诊断的重要前提.为了提高绝缘子串识别的准确率,提出一种基于平聚类分析和Adaboost的绝缘子串识别方法.首先,利用LSD线段检测提取图像中的线段;然后,统计所有线段的长度、方向及中心点位置,通过聚类分析检测平行线段,初步确定绝缘子串区域;最后,提取初定位区域的不变矩特征,运用训练的Adaboost分类器进行进一步识别.实验中,绝缘子串在平均耗时0.23s的基础下识别准确率达到91.5%.结果表明,所提方法具有较好的识别准确率和快速性.  相似文献   

7.
实现了基本的Winnow算法、Balanced Winnow算法和带反馈学习功能的Winnow算法,并将其成功地应用于大规模垃圾邮件过滤,分别在SEWM2007和SEWM2008数据集上对上述三个算法进行了对比实验.实验结果表明,Winnow算法及其变体在分类效果和效率上都优于Logiisfic算法.  相似文献   

8.
基于内容的垃圾邮件过滤问题是Internet安全技术研究的一个重点问题,而基于贝叶斯的分类方法在垃圾邮件处理上表现出了很高的准确度,因此受到了广泛的关注。在朴素贝叶斯算法的基础上,提出了一种基于最小风险贝叶斯方法同Boosting算法相结合的邮件过滤改进算法,提高了分类的精确度。实验证明,算法在邮件过滤中有更好的表现。  相似文献   

9.
在基于内容的中文反垃圾邮件技术中,中文分词是必不可少的一个环节。面对大规模的邮件训练样本和大负载的邮件服务器,中文分词算法的时间效率成为中文垃圾邮件过滤技术中的一个瓶颈。对此,提出一种应用在中文垃圾邮件过滤系统中的实时分词算法。该算法采用一种TRIE树型结构作为词典载体并基于最大匹配的原则,同时,在实时分类阶段结合hash表进行特征查询,极大地提高了系统的时间效率。  相似文献   

10.
垃圾邮件的传播越来越严重的影响到每一个人的日常生活,因而针对垃圾邮件分类的研究也日益成熟,本文介绍了KNN算法的基本原理,并将其应用在邮件分类之中,最后也提出了KNN算法在实际应用过程中的不足,并提出相应的改进意见。  相似文献   

11.
12.
序列分段问题是指将序列进行分段,用这些分段来代表一个序列,使原始序列在视觉角度基本不发生变化。本文首先介绍了三类经典的分段算法,比较它们的优劣,并针对其特点提出了一种改进的基于聚类的滑动窗口分段算法,并将其与经典算法作了一些比较,从而验证了新算法比经典算法有更好的拟合度和收敛性。  相似文献   

13.
随着手机短信成为人们日常生活交往的重要手段,垃圾短信的识别具有重要的现实意义.针对此提出一种结合TFIDF的self-attention-based Bi-LSTM的神经网络模型.该模型首先将短信文本以词向量的方式输入到BiLSTM层,经过特征提取并结合TFIDF和self-attention层的信息聚焦获得最后的特征向量,最后将特征向量通过Softmax分类器进行分类得到短信文本分类结果.实验结果表明,结合TFIDF的self-attention-based Bi-LSTM模型相比于传统分类模型的短信文本识别准确率提高了2.1%–4.6%,运行时间减少了0.6 s–10.2 s.  相似文献   

14.
在对非平衡通信文本使用随机下采样来提高分类器性能时,为了解决随机下采样样本发生有偏估计的问题,提出基于否定选择密度聚类的下采样算法(NSDC-DS)。利用否定选择算法的自体异常检测机制改善传统聚类,将样本中心点和待聚类样本分别作为检测器和自体集,对两者进行异常匹配;使用否定选择密度聚类算法对样本相似性进行评估,改进传统的下采样方法,使用NBSVM分类器对采样后的通信样本进行垃圾识别;使用PCA对样本所具有的信息量进行评估,提出改进的PCA-SGD算法对模型参数进行调优,完成通信垃圾文本的半监督识别任务。为了验证改进算法的优越性,使用不平衡通信文本等多个数据集,在否定选择密度聚类、NSDC-DS算法、PCASGD与传统模型上进行对比分析。实验结果表明,改进的模型不仅具有较好的通信垃圾文本识别能力,而且具有较快和稳定的收敛速度。  相似文献   

15.
龚伟  李柳柏 《微机发展》2007,17(3):163-165
以智能决策支持系统结构为基础,提出了一种新的电子邮件过滤模型,并对中文垃圾邮件过滤中的中文分词及垃圾邮件特征知识库的更新等关键问题进行了探讨。开发了“智能邮件过滤系统(IEFS)”,使垃圾邮件误判率得到了一定程度的控制,有效防止了垃圾邮件的泛滥。  相似文献   

16.
本文介绍了基于贝叶斯理论的实现垃圾邮件过滤的方法,详细介绍了贝叶斯理论及实现方法.  相似文献   

17.
基于语义理解的垃圾邮件过滤处理研究   总被引:1,自引:0,他引:1  
文章基于统计和基于规则的垃圾邮件过滤技术,将语义理解的研究和垃圾邮件过滤算法的研究结合起来,构建一个通过语义理解对垃圾邮件进行过滤的模型,并提出一种改进的分词算法,提高了分词的效率、准确率和识别未登录词的能力。最后通过实验数据可知,基于语义理解的过滤模型,在一定程度上解决了邮件过滤中遇到的词的“拆解”的问题、分词后所遇到的未登录词的问题,为垃圾邮件过滤提供了有益的探索。  相似文献   

18.
研究了基于SVM算法的改进朴素贝叶斯文本分类算法及在垃圾短信过滤中的应用。针对朴素贝叶斯算法条件独立性假设、过分依赖于样本空间的分布和内在不稳定性的缺陷,造成了算法时间复杂度的增加,提出了改进的基于SVM算法的朴素贝叶斯算法垃圾短信过滤的解决方案,充分结合了朴素贝叶斯算法高效分类和SVM算法增量学习及不依赖样本空间的特点;首先利用结构风险最小化原理和非线性变换将分类问题转化为二次寻优问题,最后利用朴素贝叶斯算法过滤短信,提高分类的准确度和稳定性;仿真实验结果表明,该算法能够快速得到最优分类特征子集,有效提高了垃圾短信过滤的准确率和分类速度。  相似文献   

19.
近几年,随着微信的快速发展和普及,微信已经成为智能移动设备必备的应用之一,但与之同时也出现了大量微信诈骗信息、垃圾广告等,给人们带来了极大的困扰。本文将从搜狗微信搜索中抽取微信文章样本,将微信垃圾文章识别看做文本分类问题,采用支持向量机对样本进行分类模型的训练,并应用改进的遗传算法对支持向量机的参数进行优化。文中详细的介绍了改进遗传算法在支持向量机上的应用,相比传统的支持向量机,采用改进遗传算法对支持向量机参数进行优化,提升了模型准确率和优化效率。在文章的最后进行了由15000篇微信文章所形成的测试集上的分类模型效果实验,实现结果表明,本方法能够达到94.7%的准确率,非常准确的识别微信垃圾文章。  相似文献   

20.
为了解决游客选取旅游景点以及最短旅行线路时的困惑,将智能导游引入到旅游规划中,在地图软件的基础上插入厦门的旅游景点数据进行二次开发。首先以层次聚类算法分解出游客喜好的景点集合类簇,再以改进的密度法在不同地区有针对性地以不同的搜索半径搜索附近满足要求的景点,为游客提供一个最优的旅游规划。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号