基于多策略的垃圾短信过滤系统研究 |
| |
引用本文: | 高亭,张涛林,敬毅民,陈浩然.基于多策略的垃圾短信过滤系统研究[J].数字通信世界,2017(7). |
| |
作者姓名: | 高亭 张涛林 敬毅民 陈浩然 |
| |
作者单位: | 山西大学,太原,030006 |
| |
摘 要: | 在日常生活中,垃圾短信的存在使得用户倍感困扰,用户迫切需要对垃圾短信进行过滤.本文在已标记的72000条正常短信和80000条垃圾短信基础上,建立了朴素贝叶斯模型和KNN两个文本分类模型.经测试,每个模型的综合得分都达到90%以上.本文重点介绍朴素贝叶斯分类方法和KNN分类方法在文本分类中的实际运用;该系统的评价标准,采用准确率P和召回率R的平衡F值.分析了朴素贝叶斯模型、KNN模型在不同数据集下对F值的影响,并且综合分析两个模型的优缺点,建立模型对比示意图.
|
关 键 词: | 文本分类 朴素贝叶斯 KNN算法 信息增益 |
本文献已被 万方数据 等数据库收录! |
|