首页 | 本学科首页   官方微博 | 高级检索  
     

基于朴素贝叶斯分类器的朝鲜语文本分类的研究
引用本文:周国强,崔荣一. 基于朴素贝叶斯分类器的朝鲜语文本分类的研究[J]. 中文信息学报, 2011, 25(4): 16-20
作者姓名:周国强  崔荣一
作者单位:延边大学 计算机科学与技术学科 智能信息处理研究室,吉林 延吉 133002
基金项目:国家自然科学基金资助项目(69362001)
摘    要:
该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明,该方法在朝鲜语文本分类中具有较好的效果,为朝汉结合文本分类提供了一定的依据。

关 键 词:朝鲜语  朴素贝叶斯  文本分类  TF-IDF  

Research on Korean Text Categorization Based on Naive Bayesian Classifier
ZHOU Guoqiang,CUI Rongyi. Research on Korean Text Categorization Based on Naive Bayesian Classifier[J]. Journal of Chinese Information Processing, 2011, 25(4): 16-20
Authors:ZHOU Guoqiang  CUI Rongyi
Affiliation:Intelligent Information Processing Lab., Dept. of Computer Science & Technology,
Yanbian University, Yanji, Jilin 133002, China
Abstract:
Korean text categorization based on na ve bayesian classifier is studied in this paper.Firstly,features are selected by the category selection method,and weights are calculated by estimation method as TF-IDF;Secondly,the naive bayesian classifier is established;Finally,the classifier is applied to Korean text categorization.The experiment results show that the method has good performance on Korean text classification,and it provides certain basis for the classification of text with both Korean and Chinese.
Keywords:Korean   Nave Bayesian   text categorization   TF-IDF  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号