首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于主动学习支持向量机哈萨克文文本分类方法
引用本文:古丽娜孜,孙铁利,伊力亚尔,吴迪.一种基于主动学习支持向量机哈萨克文文本分类方法[J].智能系统学报,2011,6(3):261-267.
作者姓名:古丽娜孜  孙铁利  伊力亚尔  吴迪
作者单位:1. 伊犁师范学院 电子与信息工程学院,新疆伊宁 835000;东北师范大学 计算机科学与信息技术学院,吉林长春 130117
2. 东北师范大学 计算机科学与信息技术学院,吉林长春,130117
3. 伊犁师范学院 电子与信息工程学院,新疆伊宁,835000
基金项目:教育部科技发展中心网络时代的科技论文快速共享研究项目,吉林省科技规划资助项目,吉林省教育厅“十一五”科研规划资助项目
摘    要:将文本分类理论应用于哈萨克语中,给出基于支持向量机的哈萨克文文本分类系统的设计思想.从哈萨克语言学的角度对哈萨克文分析,提出哈萨克文词干提取的方法.在对支持向量机的理论分析基础上,提出主动学习算法对支持向量机进行训练,使用训练后的分类器对新的文本进行分类.实验结果表明,该方法在哈萨克文文本分类中能获得可接受的分类性能.

关 键 词:支持向量机  哈萨克文文本分类  主动学习

An approach to the text categorization of the Kazakh language based on an active learning support vector machine
GU Linazi,SUN Tieli,YI Liyaer,WU Di.An approach to the text categorization of the Kazakh language based on an active learning support vector machine[J].CAAL Transactions on Intelligent Systems,2011,6(3):261-267.
Authors:GU Linazi  SUN Tieli  YI Liyaer  WU Di
Affiliation:GU Linazi1,2,SUN Tieli2,YI Liyaer1,WU Di2(1.School of Electronic and Information Engineering,Yili Normal University,Yining 835000,China,2.School of Computer Science and Information Technology,Northeast Normal University,Changchun 130117,China)
Abstract:In applying the theory of text categorization to the study to the Kazakh language,an approach to text categorization of Kazakh text based on a support vector machine system was introduced.In this paper,from the Kazakh linguistic angle,the method to extract word stems was analyzed.Based on analysis of the support vector machine,the proposed active learning algorithm was adopted for training.The trained classifier was used to classify new text.The experimental results show that this approach to Kazakh text cl...
Keywords:support vector machine  Kazakh text categorization  active learning  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号