首页 | 本学科首页   官方微博 | 高级检索  
     

基于半监督的SVM迁移学习文本分类算法
作者姓名:谭建平  刘波  肖燕珊
作者单位:广东工业大学自动化学院;广东工业大学计算机学院
基金项目:国家自然科学基金项目;项目编号:61472090;国家自然科学基金;项目编号:61203280;广东省自然科学杰出青年基金;项目编号:S2013050014133;广东省自然科学基金;项目编号:2015A030313486
摘    要:随着互联网的快速发展,文本信息量巨大,大规模的文本处理已经成为一个挑战。文本处理的一个重要技术便是分类,基于SVM的传统文本分类算法已经无法满足快速的文本增长分类。于是如何利用过时的历史文本数据(源任务数据)进行迁移来帮助新产生文本数据进行分类显得异常重要。文章提出了基于半监督的SVM迁移学习算法(Semi-supervised TL_SVM)来对文本进行分类。首先,在半监督SVM的模型中引入迁移学习,构建分类模型。其次,采用交互迭代的方法对目标方程求解,最终得到面向目标领域的分类器。实验验证了基于半监督的SVM迁移学习分类器具有比传统分类器更高的精确度。

关 键 词:文本分类  半监督学习  迁移学习  算法
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号