首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类综述及手机垃圾短信过滤方法的研究
引用本文:钱升华,武优西,柴欣,陈冀川. 文本分类综述及手机垃圾短信过滤方法的研究[J]. 河北工业大学学报, 2007, 36(1): 35-41
作者姓名:钱升华  武优西  柴欣  陈冀川
作者单位:河北工业大学,计算机科学与软件学院,天津,300130;河北工业大学,计算机科学与软件学院,天津,300130;河北工业大学,计算机科学与软件学院,天津,300130;河北工业大学,计算机科学与软件学院,天津,300130
摘    要:主要介绍了文本分类问题,讨论了文本分类所涉及的关键技术,包括中文分词,文本表示,特征选取方法,以及Rocchio、朴素贝叶斯、K近邻、决策树、神经网络和支持向量机等文本分类算法的原理和方法.最后,给出了基于文本分类技术的中文垃圾短信过滤方法的实验和结果.

关 键 词:文本分类  特征选取  分类算法  垃圾短信过滤
文章编号:1007-2373(2007)01-0035-07
修稿时间:2006-09-12

Text Categorization and Filtering Method for Chinese Junk Short Message
QIAN Sheng-hua,WU You-xi,CHAI Xin,CHEN Ji-chuan. Text Categorization and Filtering Method for Chinese Junk Short Message[J]. Journal of Hebei University of Technology, 2007, 36(1): 35-41
Authors:QIAN Sheng-hua  WU You-xi  CHAI Xin  CHEN Ji-chuan
Abstract:Introduces the problem of text categorization, and its important techniques, including Chinese word segmen- tation, text representation, feature selection and extraction, and algorithms of text categorization such as Rocchio, Naive Bayes, KNN, tree decision, neural network, SVM and so on. Finally, experiment and result of filtering Chinese junk short message is given.
Keywords:text categorization  feature selection and extraction  categorization algorithm  filtering junk short message
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号