首页 | 本学科首页   官方微博 | 高级检索  
     

基于多策略的垃圾短信过滤系统研究
引用本文:高亭,张涛林,敬毅民,陈浩然.基于多策略的垃圾短信过滤系统研究[J].数字通信世界,2017(7).
作者姓名:高亭  张涛林  敬毅民  陈浩然
作者单位:山西大学,太原,030006
摘    要:在日常生活中,垃圾短信的存在使得用户倍感困扰,用户迫切需要对垃圾短信进行过滤.本文在已标记的72000条正常短信和80000条垃圾短信基础上,建立了朴素贝叶斯模型和KNN两个文本分类模型.经测试,每个模型的综合得分都达到90%以上.本文重点介绍朴素贝叶斯分类方法和KNN分类方法在文本分类中的实际运用;该系统的评价标准,采用准确率P和召回率R的平衡F值.分析了朴素贝叶斯模型、KNN模型在不同数据集下对F值的影响,并且综合分析两个模型的优缺点,建立模型对比示意图.

关 键 词:文本分类  朴素贝叶斯  KNN算法  信息增益
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号