首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类技术研究
引用本文:杨丽华,戴齐,杨占华.文本分类技术研究[J].微计算机信息,2006,22(15):209-211.
作者姓名:杨丽华  戴齐  杨占华
作者单位:西南交通大学,信息科学与技术学院
基金项目:四川省应用基础研究项目
摘    要:文本分类是文本挖掘的基础和核心。文中系统地介绍了文本分类过程中涉及的各种关键技术,对特征表示、特征提取、文本分类方法及分类模型评估进行了较为详细地论述。最后,提出了文本分类中存在的问题及今后的发展。

关 键 词:文本挖掘  文本分类  特征表示  特征抽取  模型评估
文章编号:1008-0570(2006)05-3-0209-03
修稿时间:2005年9月18日

Study on Text Categorization Techniques
Yang Lihua,Dai Qi,Yang Zhanhua.Study on Text Categorization Techniques[J].Control & Automation,2006,22(15):209-211.
Authors:Yang Lihua  Dai Qi  Yang Zhanhua
Abstract:Text categorization is the basis and core of textual data mining. This survey introduces key techniques to every step of cat-egorization process, including feature representation, feature extraction, the algorithms of text classification and model evaluation. Last-ly, it presents some existing problems and future developments in text categorization field.
Keywords:text mining  text categorization  feature representation  feature extraction  model evaluation
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号