首页 | 本学科首页   官方微博 | 高级检索  
     

一种直推式多标记文档分类方法
引用本文:姜远,佘俏俏,黎铭,周志华.一种直推式多标记文档分类方法[J].计算机研究与发展,2008,45(11).
作者姓名:姜远  佘俏俏  黎铭  周志华
作者单位:南京大学计算机软件新技术国家重点实验室,南京,210093
基金项目:国家自然科学基金项目,国家"八六三"高技术研究发展计划基金项目,全国优秀博士学位论文作者专项基金项目
摘    要:真实世界的文档往往同时属于多个类别,因此,利用多标记学习技术进行文档分类是一个重要的研究方向,现有多标记文档分类方法需要利用大量有正确分类标记的文档才能获得好的分类性能,然而,在实际应用中往往只能得到少量的有标记文档作为分类所需的训练文档.出于利用未标记文档的想法,提出一种基于随机游走的直推式多标记文档分类方法,可以利用大量的未标记文档来辅助提高分类性能,实验结果表明,该方法的性能优于现有直推式多标记分类方法CNMF.

关 键 词:文档分类  多标记学习  直推学习  未标记文档  随机游走

A Transductive Multi-Label Text Categorization Approach
Jiang Yuan,She Qiaoqiao,Li Ming,Zhou Zhihua.A Transductive Multi-Label Text Categorization Approach[J].Journal of Computer Research and Development,2008,45(11).
Authors:Jiang Yuan  She Qiaoqiao  Li Ming  Zhou Zhihua
Affiliation:Jiang Yuan,She Qiaoqiao,Li Ming,, Zhou Zhihua(State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093)
Abstract:Real-world text documents usually belong to multiple classes simultaneously, and therefore, using multi-label learning technique to classify text documents is an important research direction. Existing multi-label text categorization approaches usually require using a large amount of documents with correct class labels to achieve good performance. However, in real applications it is often the case that only a small number of labeled documents can be obtained as training samples because of human and material ...
Keywords:text categorization  multi-label learning  transductive learning  unlabeled document  random walk  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号