首页 | 本学科首页   官方微博 | 高级检索  
     

使用最大熵模型进行文本分类
引用本文:陈雪天,李荣陆. 使用最大熵模型进行文本分类[J]. 计算机工程与应用, 2004, 40(35): 78-79,195
作者姓名:陈雪天  李荣陆
作者单位:复旦大学计算机与信息技术系,上海,200433;国防科技大学电子科学与工程学院,长沙,410073
摘    要:最大熵模型是一种在广泛应用于自然语言处理中的概率估计方法。文中使用最大熵模型进行了文本分类的研究。通过实验,将其和Bayes、KNN、SVM三种典型的文本分类器进行了比较,并且考虑了不同特征数目和平滑技术对基于最大熵模型的文本分类器的影响。结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法。

关 键 词:文本分类  最大熵模型  特征  N-Gram
文章编号:1002-8331-(2004)35-0078-02

Using Maximum Entropy Model for Text Categorization
Chen Xuetian Li Ronglu. Using Maximum Entropy Model for Text Categorization[J]. Computer Engineering and Applications, 2004, 40(35): 78-79,195
Authors:Chen Xuetian Li Ronglu
Abstract:Maximum Entropy Model is a probability estimation technique widely used for a variety of natural language tasks.This paper uses maximum entropy model for text categorization.It compares and analyzes its categorization performance using different approaches for different number of feature and smoothing technique.Moreover,in experiments it compares it to Bayes,KNN and SVM,and shows that its performance is higher than Bayes and comparable with KNN and SVM.The author thinks it is a promising technique for text categorization.
Keywords:text classification  Maximum Entropy Model  features  N-Gram  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号