首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于多模态特征融合的垃圾邮件过滤方法
引用本文:杨兴华,封化民,江超,陈春萍.一种基于多模态特征融合的垃圾邮件过滤方法[J].北京电子科技学院学报,2011,19(2):46-57.
作者姓名:杨兴华  封化民  江超  陈春萍
作者单位:1. 西安电子科技大学通信工程学院,陕西西安,710071
2. 西安电子科技大学通信工程学院,陕西西安,710071;北京电子科技学院,北京,100070
基金项目:国家自然科学基金项目“基于多模态特征的多媒体语义分析关键理论与技术研究(No.60972139)”; 北京市自然科学基金项目“基于网络多媒体信息语义的网络舆情分析研究”(No.4092041)”的资助
摘    要:近年来,垃圾邮件制造者为了逃避基于文本的垃圾邮件过滤系统的检测,将垃圾信息嵌入到图像中,并将其附着在邮件正文中进行传播。传统的基于文本的过滤方式无法处理此类包含垃圾信息的邮件图像。为了应对这种同时包含文本和图像的垃圾邮件,本文提出了一种基于多模态特征的融合文本、图像等多媒体信息的过滤方法。首先通过抽取邮件的文本特征和图像特征构建多个分类器,然后采用多分类器融合技术对各分类器的输出结果进行综合。通过对TREC垃圾邮件语料集的测试实验表明,本文提出多模态特征融合的方法获得了比单个分类器更好的效果,准确率达到90%以上。

关 键 词:垃圾邮件过滤  多模态特征  多分类器融合  置信度

A Spam Filtering Method Based on Multi-modal Feature Fusion
YANG Xing-hua,FENG Hua-min,JIANG Chao,CHEN Chun-ping.A Spam Filtering Method Based on Multi-modal Feature Fusion[J].Journal of Beijing Electronic Science & Technology Institute,2011,19(2):46-57.
Authors:YANG Xing-hua  FENG Hua-min  JIANG Chao  CHEN Chun-ping
Affiliation:YANG Xing-hua FENG Hua-min JIANG Chao CHEN Chun-ping 1.School of Telecommunications Engineering,Xidian University,Xi' an Shaanxi 710071,P.R.China,2.Department of Telecommunications Engineering,Beijing Electronic Science and Technology Institute,Beijing 100070
Abstract:In recent years,for escaping the text-based spam filtering detection system,the spammers insert junk information into the image and attach it to the message body.In order to deal with such spam that contains text and images,a new filtering method is proposed,which fuses text,image and other multi-modal features by extracting the text features and image features to build multiple classifiers,and by employing multiple classifier fusion technology to integrate the output of each classifier.The experimental res...
Keywords:spam filtering  multi-modal feature  multiple classifier fusion  degree of confidence  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号