首页 | 本学科首页   官方微博 | 高级检索  
     

基于背景学习的迭代式文本分类框架
引用本文:石文娟,龙舜,云飞.基于背景学习的迭代式文本分类框架[J].计算机工程与应用,2015(9).
作者姓名:石文娟  龙舜  云飞
作者单位:暨南大学 信息科学技术学院 计算机系,广州,510632
基金项目:国家自然科学基金(No.61272073);广东省自然科学基金(No.S2013020012865)。
摘    要:随着网络文本数据呈指数级增长,信息的人工分类和管理逐渐被计算机自动分类所替代,相关领域经过多年的研究和发展已经开发出一些相对成熟的算法。研究分析发现:在文本预处理阶段歧义语段的划分始终是影响分类准确率的一个重要因素,至今仍未完全解决。结合互信息度理论,提出一种基于背景学习的迭代式框架,在此基础上通过对分词数据预处理来改进传统的基于朴素贝叶斯模型的文本分类算法,并使用新浪网不同类别数据对提出的迭代式框架进行实验评估,实验结果表明提出的基于背景学习的迭代式文本分类框架可行有效。

关 键 词:背景知识  迭代  互信息度  朴素贝叶斯  文本分类  歧义消除

Iterative text classification framework based on background learning
SHI Wenjuan,LONG Shun,YUN Fei.Iterative text classification framework based on background learning[J].Computer Engineering and Applications,2015(9).
Authors:SHI Wenjuan  LONG Shun  YUN Fei
Abstract:
Keywords:background knowledge  iteration  mutual information  Naive Bayesian  text categorization  disambiguation
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号