首页 | 本学科首页   官方微博 | 高级检索  
     

面向不均衡类别朴素贝叶斯犯罪案件文本分类
引用本文:程春惠,何钦铭. 面向不均衡类别朴素贝叶斯犯罪案件文本分类[J]. 计算机工程与应用, 2009, 45(35): 126-128. DOI: 10.3778/j.issn.1002-8331.2009.35.038
作者姓名:程春惠  何钦铭
作者单位:浙江大学计算机科学与技术学院,杭州,310027;浙江大学计算机科学与技术学院,杭州,310027
基金项目:浙江省重大科技攻关项目 
摘    要:针对案件文本的特点,提出了具有针对性的特殊文本预处理方法,并比较了两种有效的特征选择方法。针对案件类别分布不均衡的特点,提出了改进的多变量贝努里模型。实验结果表明,改进的多变量贝努里模型有效地提高了案件文本分类的准确率。

关 键 词:文本分类  朴素贝叶斯  犯罪挖掘  多变量贝努里模型  多项式模型
收稿时间:2009-05-27
修稿时间:2009-7-3 

Naive Bayes based criminal text classification of unbalanced classes
CHENG Chun-hui,HE Qin-ming. Naive Bayes based criminal text classification of unbalanced classes[J]. Computer Engineering and Applications, 2009, 45(35): 126-128. DOI: 10.3778/j.issn.1002-8331.2009.35.038
Authors:CHENG Chun-hui  HE Qin-ming
Affiliation:College of Computer Science,Zhejiang University,Hangzhou 310027,China
Abstract:According to the feature of case text,this paper explores the special text preprocessing method and compares two effective feature selection methods.An improved model based on multi-variate Bernoulli model is proposed,due to the unbalanced distribution of criminal case categories.The experiment indicates that the improved Naive Bayes method performs better in the case text classification.
Keywords:text classification  Naive Bayes  criminal mining  multi-variate Bernoulli model  multinomial mode
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号