首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征映射的半监督文本分类算法
引用本文:杜芳华,冀俊忠,赵学武,吴晨生.基于特征映射的半监督文本分类算法[J].北京工业大学学报,2016,42(2):230-235.
作者姓名:杜芳华  冀俊忠  赵学武  吴晨生
作者单位:北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室,北京,100124;北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室,北京100124;南阳师范学院软件学院,河南南阳473061;北京市科学技术情报研究所,北京,100048
基金项目:国家自然科学基金资助项目(61375059)
摘    要:针对已标记数据与未标记数据分布不一致可能导致半监督分类器性能降低的不足,提出了一种基于特征映射的半监督文本分类算法.首先通过不同的特征选择方法,分别在训练集的已标记数据、未标记数据以及测试集数据中选取各自的特征集,并初始化特征的权值;在此基础之上,分别建立已标记数据与未标记数据、已标记数据与测试集数据、未标记数据与测试集数据之间的映射函数,并利用这3个特征映射函数重新计算特征的权重;最后利用期望最大比(expectation maximization,EM)算法进行半监督文本分类.在标准数据集上的实验结果表明:提出的算法是有效的.

关 键 词:特征映射  迁移学习  半监督学习  文本分类

Semi-supervised Text Classification Algorithm Based on a Feature Mapping
DU Fanghua,JI Junzhong,ZHAO Xuewu,WU Chensheng.Semi-supervised Text Classification Algorithm Based on a Feature Mapping[J].Journal of Beijing Polytechnic University,2016,42(2):230-235.
Authors:DU Fanghua  JI Junzhong  ZHAO Xuewu  WU Chensheng
Abstract:
Keywords:feature mapping  transfer learning  semi-supervised learning  text classification
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号