基于半监督的SVM迁移学习文本分类算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于半监督的SVM迁移学习文本分类算法

作者姓名：	谭建平刘波肖燕珊

作者单位：	广东工业大学自动化学院;广东工业大学计算机学院

基金项目：	国家自然科学基金项目;项目编号:61472090;国家自然科学基金;项目编号:61203280;广东省自然科学杰出青年基金;项目编号:S2013050014133;广东省自然科学基金;项目编号:2015A030313486

摘要：	随着互联网的快速发展,文本信息量巨大,大规模的文本处理已经成为一个挑战。文本处理的一个重要技术便是分类,基于SVM的传统文本分类算法已经无法满足快速的文本增长分类。于是如何利用过时的历史文本数据(源任务数据)进行迁移来帮助新产生文本数据进行分类显得异常重要。文章提出了基于半监督的SVM迁移学习算法(Semi-supervised TL_SVM)来对文本进行分类。首先,在半监督SVM的模型中引入迁移学习,构建分类模型。其次,采用交互迭代的方法对目标方程求解,最终得到面向目标领域的分类器。实验验证了基于半监督的SVM迁移学习分类器具有比传统分类器更高的精确度。
关键词：	文本分类半监督学习迁移学习算法
本文献已被 CNKI 等数据库收录！