首页 | 官方网站   微博 | 高级检索  
     

面向不均衡类别朴素贝叶斯犯罪案件文本分类
引用本文:程春惠,何钦铭.面向不均衡类别朴素贝叶斯犯罪案件文本分类[J].计算机工程与应用,2009,45(35):126-128.
作者姓名:程春惠  何钦铭
作者单位:浙江大学计算机科学与技术学院,杭州,310027
基金项目:浙江省重大科技攻关项目 
摘    要:针对案件文本的特点,提出了具有针对性的特殊文本预处理方法,并比较了两种有效的特征选择方法。针对案件类别分布不均衡的特点,提出了改进的多变量贝努里模型。实验结果表明,改进的多变量贝努里模型有效地提高了案件文本分类的准确率。

关 键 词:文本分类  朴素贝叶斯  犯罪挖掘  多变量贝努里模型  多项式模型
收稿时间:2009-5-27
修稿时间:2009-7-3  

Naive Bayes based criminal text classification of unbalanced classes
CHENG Chun-hui,HE Qin-ming.Naive Bayes based criminal text classification of unbalanced classes[J].Computer Engineering and Applications,2009,45(35):126-128.
Authors:CHENG Chun-hui  HE Qin-ming
Affiliation:College of Computer Science,Zhejiang University,Hangzhou 310027,China
Abstract:According to the feature of case text,this paper explores the special text preprocessing method and compares two effective feature selection methods.An improved model based on multi-variate Bernoulli model is proposed,due to the unbalanced distribution of criminal case categories.The experiment indicates that the improved Naive Bayes method performs better in the case text classification.
Keywords:text classification  Naive Bayes  criminal mining  multi-variate Bernoulli model  multinomial mode
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号