首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类技术研究
引用本文:曹锋,张代远.文本分类技术研究[J].数字社区&智能家居,2009(32).
作者姓名:曹锋  张代远
作者单位:南京邮电大学计算机学院;
摘    要:文本分类作为机器学习和信息检索之间的交叉学科,涉及到多个领域的技术。它的完善有赖于各个相关领域的技术发展和提高,该文介绍了文本分类过程中的各个关键技术和存在的问题,讨论了文本表示模型、分类算法、分类器性能评价原理和方法,最后并对今后的发展进行了展望。

关 键 词:文本分类  分类算法  VSM(Vector  Space  Model)  语义网络  特征提取  

Research of Text Categorization Technique
CAO Feng,ZHANG Dai-yuan.Research of Text Categorization Technique[J].Digital Community & Smart Home,2009(32).
Authors:CAO Feng  ZHANG Dai-yuan
Affiliation:CAO Feng,ZHANG Dai-yuan (School of Computer,Nanjing University of Posts & Telecommunications,Nanjing 210003,China)
Abstract:As an intersection of machine learning and information retrieve, text categorization refers to technology of multi-field. Its improvements rely on the technology development of multi-fields. In the paper, key technologies and problems of text categorization are presented. The model of text representation, algorithm of text categorization and text categorization classifier evaluation are discussed. In the end, the prospect of categorization techniques is given.
Keywords:text categorization  categorization method  VSM(vector space model)  semantic network  feature selection  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号